20 KiB
🧬 ЭПИК: Автономное саморазвитие платформы оркестратора
Статус: концепция v2 (структура согласована Славой 09.06 → ждёт финального апрува → декомпозиция) Автор: Стрим · Дата: 2026-06-09 · Заказчик: Слава Связанные: ORCH-8 (петля самообучения), ORCH-83 (наблюдаемость), ORCH-54 (автономное внедрение, done) Источники: память орка (инциденты 06–09.06), инвентаризация 94 задач Plane, мировые практики (STRATUS NeurIPS'25, ChaosEater ASE'25, self-healing LLM-agents arXiv'26, agentic AIOps, FinOps token-economics).
0. Зачем это (vision)
Оркестратор уже автономно внедряет (ORCH-54: задача проходит analysis→prod без человека). Но автономность исполнения ≠ автономное развитие. Сегодня платформу развивает связка Слава+Стрим вручную: ловим инциденты → формулируем уроки → заводим задачи → апрувим.
Цель эпика: управляемый самоподдерживающийся контур, где платформа сама замечает свои слабые места И возможности роста, предлагает улучшения как готовые задачи, проводит их через собственный конвейер (ORCH-7 self-hosting) — под контролем человека на ключевых развилках (safety > автономность).
Принцип баланса (коррекция Славы 09.06): саморазвитие — это НЕ только «не падать и не косячить». Стабильная платформа, которая не растёт в возможностях, — тупик. Рост функционала (новые фичи, стеки, удобства для заказчиков) — равноценный домен, а не следствие надёжности. Платформа развивается по двум рукам одновременно: крепнет (надёжность/качество/экономика) И раздаётся вширь (возможности/масштаб).
1. Архитектура эпика: фундамент + 5 доменов + 2 вертикали
┌─────────────────────────────────────────────────────────────┐
│ ВЕРТИКАЛЬ-ДВИГАТЕЛЬ 🧠 ВЕРТИКАЛЬ-ТОРМОЗ 🛑 │
│ петля обучения ORCH-8 governance / safety L0-L3 │
│ (генерит улучшения) (ограничивает, апрувы) │
│ ░░░░░░░░░░░░ проходят СКВОЗЬ все домены ░░░░░░░░░░░░░░░░░░░░░ │
├─────────────────────────────────────────────────────────────┤
│ ДОМЕНЫ РАЗВИТИЯ (равноценные, две руки роста) │
│ │
│ КРЕПНЕТ ───────────────────► РАЗДАЁТСЯ ВШИРЬ ────────► │
│ 🛡️ D1 Надёжность 🚀 D4 Возможности (фичи) │
│ ✅ D2 Качество/Доверие 📈 D5 Масштаб │
│ 💰 D3 Экономика │
├─────────────────────────────────────────────────────────────┤
│ ФУНДАМЕНТ (слой 0): 👁️ Наблюдаемость + 📒 Журнал уроков │
│ глаза и память — без них всё слепо │
└─────────────────────────────────────────────────────────────┘
Общая метрика-объединитель: 🌡️ ГРАДУСНИК АВТОНОМНОСТИ
(каждый домен двигает её вверх контролируемо)
Что изменилось против v1 (мои же правки по критике)
- Наблюдаемость вынесена в фундамент (была внутри M1) — она питает ВСЁ.
- M0 разбит на 2 вертикали: двигатель (петля) и тормоз (governance) — у них противоположная логика, нельзя в одну коробку.
- Добавлен домен D2 Качество/Доверие — была дыра: надёжная платформа может стабильно генерить говнокод. Надёжность инфры ≠ корректность результата.
- Рост (D4+D5) — равноценные домены, не «второй эшелон» (коррекция Славы).
- Градусник автономности — сквозная измеримая цель вместо абстракции.
2. ФУНДАМЕНТ (слой 0) — 👁️ Глаза и 📒 Память
Без данных нечем ни чинить, ни считать, ни приоритизировать, ни учиться. Строится первым.
- F1 Наблюдаемость (ORCH-83 [ЭПИК]): метрики agent-liveness + очередь + стадии + хост (диск/память/CPU) + контейнеры + внешние деп (Plane/Gitea/Anthropic). Эндпоинты /health /status /queue → расширить до /metrics + дашборд.
- F2 Журнал уроков (ORCH-8 шаг 1): машинная структурированная таблица отклонений (тип, контекст, корень, предложение, статус) — формализовать то, что сейчас в memory/. Это «топливо» для вертикали-двигателя.
3. ДОМЕН D1 — 🛡️ Надёжность (Self-Repairing)
Есть: reconciler (53), post-deploy monitor+rollback (21), merge-verify (71/73), reaper (65), disk-watchdog (63), build-prune (62). Уроки: фантом-merge, deploy-петли, транзиенты, флапп-статусы, зомби-jobs.
- D1.1 Предиктивный мониторинг (causal, не порог): «диск заполнится через N ч».
- D1.2 Авто-ремедиация рантайма: каталог типовых фиксов (зомби-job→requeue, stale-lease→reclaim, флапп→форс-терминал).
- D1.3 Транзиент-резилентность everywhere (обобщение ORCH-93): единый retry+backoff для всех внешних вызовов.
- D1.4 Zero-downtime деплой платформы (blue-green/canary): резервное плечо вместо окна недоступности.
- D1.5 Авто-rollback по SLO (расширение 21): откат по деградации latency/error-rate, не только health.
- D1.6 Deep agent-liveness (self-healing LLM): «думает / завис / зациклился» по reasoning+CPU+прогрессу.
- D1.7 Backup/restore БД+worktree (recovery после краша хоста).
4. ДОМЕН D2 — ✅ Качество / Доверие результата
Новый домен. Закрывает дыру: платформа может надёжно и дёшево производить плохой результат. Надёжность инфры ≠ корректность кода/аналитики.
Есть: security-гейт (22), reviewer/tester стадии, промпт-аудит (92).
- D2.1 Code-coverage гейт (ORCH-27): защита от деградации покрытия.
- D2.2 Регресс-страж результата: не только «тесты зелёные», но «не сломали соседнюю фичу» (расширение regression-guard ORCH-73).
- D2.3 Качество аналитики: метрика «BRD не пришлось переделывать», сверка факт vs ТЗ (как сегодня ловила ложное P0).
- D2.4 Доверие к выходу: provenance артефактов, воспроизводимость, «деплой OK = прод реально работает» (урок ET-8).
- D2.5 Опциональная человеческая приёмка важных фич (ORCH-28).
- D2.6 Само-оценка агентов: уверенность в результате → эскалация при низкой.
5. ДОМЕН D3 — 💰 Экономика
Боль (ORCH-38): developer сжёг $13.68 на мелочь (cache_read 18.98M — слепое сканирование src/).
- D3.1 Model-routing cascade (мир: −87%): классификатор сложности → дешёвая модель на простое, opus на сложное (ORCH-20+13).
- D3.2 Бюджет circuit-breaker (ORCH-23): хард-лимит $/токенов/времени → пауза+алерт.
- D3.3 Оценка задачи ДО старта (ORCH-20): прогноз $/время по истории.
- D3.4 Целевые файлы в задании (ORCH-38): analyst даёт точный список из TRZ → нет слепого сканирования. Самый дешёвый высокий impact.
- D3.5 Fast-track простых задач (ORCH-19): багфикс → урезанный цикл без architect, дешёвая модель.
- D3.6 Semantic caching / prompt compression (мир: −31%).
- D3.7 Cost-дашборд + детект аномалий.
6. ДОМЕН D4 — 🚀 Возможности (рост функционала)
Равноценный домен (акцент Славы). Это то, ради чего платформой ПОЛЬЗУЮТСЯ. Без новых возможностей надёжность бессмысленна — нечего надёжно делать. Развивается параллельно с D1-D3, а не после.
Backlog-зародыши: ORCH-12/13/14/15/18/24/25.
- D4.1 Стеки-плагины: профили стека (web/mobile/data/ML/embedded) → агенты адаптируют процесс. Расширяемо без правки ядра. Открывает заказчикам новые типы проектов.
- D4.2 Android/мобильный стек (ORCH-15): полноценная разработка приложений.
- D4.3 UX/UI-дизайнер (ORCH-14): дизайнер-агент генерит макеты на аналитике, согласование с BRD.
- D4.4 Интерактивный аналитик (ORCH-18): живой диалог Слава↔analyst — уточнение BRD, обсуждение вариантов до старта. Удобство + качество постановки.
- D4.5 Тяжёлые вычисления (ORCH-12): воркер/стадия для долгих расчётов (ML-обучение, миграции данных).
- D4.6 База знаний проекта (ORCH-24): RAG-контекст решений/архитектуры — агенты умнее (+экономия).
- D4.7 Декомпозиция эпиков (ORCH-25): эпик→задачи→сборка автоматически (этот документ — кандидат №1).
- D4.8 Новые роли-агенты: data-engineer, ML-инженер, DevOps — по мере типов проектов.
- D4.9 Мультипровайдерность моделей (ORCH-13): не только Claude — выбор под задачу/стек/бюджет.
7. ДОМЕН D5 — 📈 Масштаб
Вторая «рука роста»: способность делать БОЛЬШЕ и ШИРЕ. Сейчас потолок —
max_concurrency=1.
Backlog-зародыши: ORCH-9/10; done: ORCH-6 (multi-repo), ORCH-88 (serial-batch).
- D5.1 Параллельная разработка (снять max_concurrency=1): безопасный N>1 (изоляция worktree есть, нужна merge-orchestration FIFO + защита main). Много фич параллельно = быстрее растём.
- D5.2 Turnkey-онбординг проекта (ORCH-9): команда → Plane+Gitea+агенты+инфра за минуты.
- D5.3 Тиражирование на новый хост (ORCH-10): перенос платформы на инфру нового заказчика (IaC-bundle).
- D5.4 Горизонтальный воркер-пул: очередь jobs (ORCH-1) → несколько воркеров/хостов.
- D5.5 Per-project лимиты ресурсов (concurrency/бюджет на проект).
- D5.6 Мультитенантность (отложено — SaaS-сценарий, по спросу).
8. ВЕРТИКАЛЬ-ДВИГАТЕЛЬ 🧠 — петля самообучения (ORCH-8)
Проходит сквозь ВСЕ домены: генерит для каждого кандидаты-улучшения.
ДЕТЕКЦИЯ → ЖУРНАЛ урока → АНАЛИЗ/паттерны → ПРЕДЛОЖЕНИЕ задачи → [governance-гейт] → конвейер ORCH-7 → проверка эффекта → журнал
- Детекция: провал гейта, ручное вмешательство (самый ценный сигнал — каждый ручной пинок = дыра автономности), ретраи/откаты/таймауты, ложные срабатывания, «деплой OK / прод сломан».
- Анализ (гибрид): машина копит и предлагает черновик → Стрим фильтрует/оформляет → Слава апрувит.
- E1 Журнал уроков (=F2). E2 Агент-ретроспективщик (анализ→предложение). E3 Приоритизатор RICE (impact/cost/risk → что брать первым по всем доменам).
9. ВЕРТИКАЛЬ-ТОРМОЗ 🛑 — Governance / Safety
«Контроль и управление саморазвитием» (требование Славы). Двигатель жмёт газ — этот контур держит руль и тормоз.
Принцип (ORCH-8, незыблемо): самомодификация платформы (промпты/скиллы/конфиги агентов/ядро) — ТОЛЬКО через PR+ревью+апрув Славы. Орк ПРЕДЛАГАЕТ, ПРИМЕНЯЕТ через свой конвейер с гейтами.
Уровни автономии (agentic AIOps maturity):
| Уровень | Что авто | Гейт |
|---|---|---|
| L0 reactive | только алерт | человек делает всё |
| L1 assistive | предложить задачу+ТЗ | человек апрувит запуск |
| L2 autonomous-bounded | гонит безопасные классы (бэкенд-фиксы) до прода | safety-гейты CI/staging/regression |
| L3 self-modifying | менять агентов/ядро | всегда PR+апрув Славы, НИКОГДА не авто |
- G1 Safety-политика L0-L3 + per-class правила (что можно само, что только через Славу). Лейблы autoApprove/autoDeploy (ORCH-89) = уже зародыш.
- G2 Бюджет на саморазвитие: лимит $/мес, чтобы контур не жёг бесконтрольно.
- G3 Дашборд эволюции: метрики 5 доменов в динамике — видно, КУДА развивается платформа.
- G4 Kill-switch петли: остановить самогенерацию задач одним флагом.
10. 🌡️ Градусник автономности (сквозная метрика)
Объединяющая измеримая цель эпика. Каждый домен двигает её вверх:
- % задач без ручного пинка (сегодня было ~5 вмешательств: апрувы, домерж 063, sync 061).
- Ручных вмешательств / неделю (тренд вниз).
- MTBF / MTTR платформы (D1).
- $/задача, токены/задача, время/задача (D3).
- Типов проектов/стеков поддержано (D4).
- Задач параллельно (D5).
- % уроков, ставших задачами (двигатель).
11. Связь с Backlog (ничего не теряем)
| Backlog | Домен/вертикаль |
|---|---|
| ORCH-8 петля | 🧠 Двигатель (ядро) |
| ORCH-83 наблюдаемость | Фундамент F1 |
| ORCH-20/23/38/19 | 💰 D3 |
| ORCH-27/28 | ✅ D2 |
| ORCH-12/13/14/15/18/24/25 | 🚀 D4 |
| ORCH-9/10 | 📈 D5 |
| ORCH-94 флапп | 🛡️ D1.2 |
| ORCH-89 авто-лейблы | 🛑 G1 |
~18 backlog-задач ложатся в структуру. Эпик их систематизирует и достраивает.
12. Дорожная карта (предложение)
- Фаза 0 (фундамент): F1 наблюдаемость + F2 журнал. Без них рулить нечем.
- Фаза 1 (две руки параллельно):
- крепнем: D3.4 целевые файлы + D3.2 бюджет-breaker (дешёвый impact)
- растём: D4.1 стеки-плагины ИЛИ D4.4 интерактив-аналитик (по спросу)
- Фаза 2: D1 надёжность (транзиент-резилентность, авто-ремедиация) + D2 качество + D5.1 параллелизм.
- Фаза 3 (мозг): E2 ретроспективщик + E3 приоритизатор + G1 safety-политика → петля замыкается, дальше платформа предлагает сама.
13. Открытые вопросы Славе
- Структура Plane: мега-эпик с фундаментом+5 доменами+2 вертикалями? Или эпик на каждый домен?
- D4 (возможности): какой стек/фича приоритетны для тебя/заказчиков — Android, UX/UI, тяжёлые расчёты, интерактив-аналитик? С чего рост начинать?
- Баланс «крепнем vs растём»: идти строго параллельно обеими руками, или в каждой фазе перевес в одну сторону?
- Safety L3: подтверждаешь — самомодификация ядра/агентов всегда через твой апрув?
- Ретроспективщик (E2): агент сразу, или сначала Стрим вручную ведёт журнал?
- Бюджет на эпик (G2): лимит $/мес?
- Первая задача после апрува: F1 наблюдаемость, быстрая победа D3.4, или сразу рост D4.*?