auto-sync: 2026-06-09 22:10:01

This commit is contained in:
Stream
2026-06-09 22:10:01 +03:00
parent 54b6b3a70c
commit 8a67f15eaa
2 changed files with 196 additions and 172 deletions

View File

@@ -226,3 +226,13 @@
- **Мир-практики:** STRATUS NeurIPS'25 (мультиагент SRE), ChaosEater ASE'25, self-healing LLM-agents arXiv'26, causal AIOps Stanford, model-routing 87%/semantic-caching 31%, FinOps guardrails.
- **6 открытых вопросов Славе** в доке (структура Plane, safety L3, приоритет фаз, ретроспективщик сразу/потом, бюджет на эпик, первая задача).
- ⏳ Ждёт апрува концепции → потом декомпозиция в задачи Plane. НЕ заводила задачи (концепция первая).
## 🧬→v2 Концепция эпика ПЕРЕСМОТРЕНА (Слава: «беру твоё предложение за основу + рост фич очень нужен», 09.06 ~19:02 MSK)
- Слава попросил критику моей же схемы → дала честную (пересечения модулей, наблюдаемость зря в M1, M0=мозг недооценён, нет оси КАЧЕСТВА). Слава: берём за основу, НО саморазвитие — не только стабильность/качество, **рост фич равноценен**.
- **Переписала документ v2** (структура: фундамент + 5 доменов + 2 вертикали):
- **Фундамент (слой 0):** F1 наблюдаемость (ORCH-83) + F2 журнал уроков (ORCH-8 шаг1).
- **5 доменов (равноценны, «две руки роста»):** D1 Надёжность / D2 Качество-Доверие (НОВЫЙ — надёжная платформа ≠ корректный результат) / D3 Экономика / **D4 Возможности-фичи (равноценный, акцент Славы — не второй эшелон!)** / D5 Масштаб.
- **2 вертикали сквозь всё:** Двигатель (петля ORCH-8) + Тормоз (governance/safety L0-L3).
- **Градусник автономности** — сквозная метрика.
- **Ключевая правка Славы:** D4 (Android/UX-UI/интерактив-аналитик/тяжёлые расчёты/стеки-плагины/база знаний) + D5 — РАВНОЦЕННЫ надёжности, параллельно, не после. «Стабильная платформа без роста = тупик».
- 7 вопросов Славе. Документ: EPIC_AUTONOMOUS_SELF_EVOLUTION.md (v2, 12.8КБ). Ждёт финального апрува → декомпозиция.

View File

@@ -1,6 +1,6 @@
# 🧬 ЭПИК: Автономное саморазвитие платформы оркестратора
> **Статус:** концепция (для апрува Славы → декомпозиция в задачи)
> **Статус:** концепция v2 (структура согласована Славой 09.06 → ждёт финального апрува → декомпозиция)
> **Автор:** Стрим · **Дата:** 2026-06-09 · **Заказчик:** Слава
> **Связанные:** ORCH-8 (петля самообучения), ORCH-83 (наблюдаемость), ORCH-54 (автономное внедрение, done)
> **Источники:** память орка (инциденты 0609.06), инвентаризация 94 задач Plane, мировые практики (STRATUS NeurIPS'25, ChaosEater ASE'25, self-healing LLM-agents arXiv'26, agentic AIOps, FinOps token-economics).
@@ -9,198 +9,212 @@
## 0. Зачем это (vision)
Оркестратор уже **автономно внедряет** (ORCH-54 достигнут: задача проходит analysis→prod без человека). Но автономность исполнения ≠ автономное **развитие**. Сегодня платформу развивает связка Слава+Стрим вручную: ловим инциденты → формулируем уроки → заводим задачи → апрувим.
Оркестратор уже **автономно внедряет** (ORCH-54: задача проходит analysis→prod без человека). Но автономность исполнения ≠ автономное **развитие**. Сегодня платформу развивает связка Слава+Стрим вручную: ловим инциденты → формулируем уроки → заводим задачи → апрувим.
**Цель эпика:** превратить это в управляемый самоподдерживающийся контур, где платформа сама:
- замечает свои слабые места (надёжность, стоимость, узкие места),
- предлагает улучшения как готовые задачи,
- проводит их через собственный конвейер (ORCH-7 self-hosting),
- **под контролем человека на ключевых развилках** (safety > автономность).
**Цель эпика:** управляемый самоподдерживающийся контур, где платформа сама замечает свои слабые места И возможности роста, предлагает улучшения как готовые задачи, проводит их через собственный конвейер (ORCH-7 self-hosting) — **под контролем человека на ключевых развилках** (safety > автономность).
Эпик делится на **4 модуля развития** + **1 управляющий контур** (мета-слой, который рулит первыми четырьмя).
**Принцип баланса (коррекция Славы 09.06):** саморазвитие — это НЕ только «не падать и не косячить». Стабильная платформа, которая не растёт в возможностях, — тупик. **Рост функционала (новые фичи, стеки, удобства для заказчиков) — равноценный домен, а не следствие надёжности.** Платформа развивается по двум рукам одновременно: крепнет (надёжность/качество/экономика) И раздаётся вширь (возможности/масштаб).
---
## 1. Принцип деления (по Славе)
## 1. Архитектура эпика: фундамент + 5 доменов + 2 вертикали
| # | Модуль | Суть | Метрика успеха |
|---|--------|------|----------------|
| **M1** | 🛡️ **Self-Repairing** (надёжность) | Стабильность, отказоустойчивость, производительность БЕЗ потери функциональности | MTBF↑, MTTR↓, % автономных задач без ручного пинка↑ |
| **M2** | 🚀 **Расширение функционала** | Новые возможности для заказчиков: стеки, фичи, удобства | число поддержанных типов проектов/стеков↑ |
| **M3** | 💰 **Экономика** | Оптимизация $/токенов/времени/ресурсов на задачу + контроль расходов | $/задача↓, токены/задача↓, время/задача↓ при том же качестве |
| **M4** | 📈 **Масштабируемость** | Параллелизм, онбординг проектов, перенос на новую инфру | задач параллельно↑, время онбординга проекта↓ |
| **M0** | 🧭 **Управление саморазвитием** | Мета-контур: петля обучения, приоритизация, safety-гейты, дашборд эволюции | покрытие уроков→задачами↑, 0 неконтролируемых самоизменений |
---
## 2. Мировые практики (что берём)
- **STRATUS (NeurIPS'25)** — мультиагентная автономная reliability-инженерия облака: агенты-расследователи + remediation с гарантиями безопасности. → паттерн для M1 (агент-SRE).
- **ChaosEater (ASE'25)** — автоматизация chaos-engineering через LLM. → M1: периодически инъецировать сбои в staging, проверять самовосстановление.
- **Self-Healing LLM-agents (arXiv 2026)** — мониторинг ВНУТРЕННЕГО reasoning агента + внешних результатов исполнения. → M0/M1: liveness не только по pid, но по «думает ли осмысленно».
- **Agentic AIOps (LogicMonitor/Deimos 2025-26)** — зрелость: reactive→assistive→autonomous; «humans still press enter» на критичном. → M0 safety-модель.
- **Causal AIOps (Stanford NeurIPS'25)** — предсказание сбоев плато на ~90% без причинно-следственного вывода. → M1 предиктивный мониторинг = causal, не только корреляция.
- **Model routing cascades (87% стоимости)** + **semantic caching (31%)** + **prompt compression (LLMLingua)** + **runtime token governance** (TechTarget'26). → прямо в M3.
- **FinOps guardrails** (Flexera/Amnic 2026): автономные cost-гардрейлы, бюджет-aware решения, аномалии расходов. → M3 + M0.
---
## 3. МОДУЛЬ M1 — 🛡️ Self-Repairing (надёжность)
**Что уже есть (фундамент):** reconciler (ORCH-53), post-deploy monitor+rollback (ORCH-21), merge-verify (ORCH-71/73), job-reaper+stale-lease (ORCH-65), security-гейт (ORCH-22), disk-watchdog (ORCH-63), build-cache-prune (ORCH-62).
**Уроки из истории, которые M1 закрывает системно:**
- Фантом-merge (08.06): прод расходился с main, 4 PR не слиты → накопительная потеря кода.
- Deploy-петля (0607.06): bootstrap-парадокс, ложный staging FAIL.
- Транзиенты (09.06): Anthropic Overloaded (отретраился) + Gitea 405 (не отретраился → ложный HOLD).
- Флаппинг статусов (09.06, ORCH-94): done-задача дёргает deploy-статусы вечно.
- Зомби-jobs/merge-lease залип (06.06).
**Кандидаты-задачи M1:**
- **M1.1 Предиктивный мониторинг** (на базе ORCH-83): time-series по диску/памяти/очереди → алерт ДО исчерпания (causal, не только порог). Прогноз «диск заполнится через N часов».
- **M1.2 Авто-ремедиация рантайма** (расширение reconciler): типовые сбои чинятся сами по runbook (зомби-job→requeue, stale-lease→reclaim, флапп-статус→форс-терминал). Каталог авто-фиксов.
- **M1.3 Транзиент-резилентность everywhere** (обобщение ORCH-93): единый retry-with-backoff слой для ВСЕХ внешних вызовов (Gitea/Plane/Anthropic) — breaker-паттерн как у агентов.
- **M1.4 Zero-downtime деплой** платформы: blue-green/canary для self-hosting (сейчас рестарт = окно недоступности). Резервное плечо.
- **M1.5 Авто-rollback по SLO** (расширение ORCH-21): не только health-check, но деградация метрик (latency/error-rate) → откат.
- **M1.6 Chaos-в-staging** (ChaosEater-паттерн): периодически ломать staging, проверять что monitor+rollback ловят.
- **M1.7 Agent-liveness deep** (self-healing LLM): детект «агент думает vs завис vs зациклился» по reasoning+CPU+прогрессу (урок: analyst завис 22 мин, лезли в /proc).
- **M1.8 Backup/restore** БД орка + worktree-state (durable recovery после краша хоста).
---
## 4. МОДУЛЬ M2 — 🚀 Расширение функционала
**Backlog уже содержит зародыши:**
- **ORCH-12** тяжёлые миграции/расчёты (опциональная стадия).
- **ORCH-14/18** UX/UI дизайнер + интерактивный аналитик (живой диалог, макеты).
- **ORCH-15** Android-приложения (мобильный стек).
- **ORCH-13** мультипровайдерность LLM (Claude+OpenRouter+др).
- **ORCH-24** персистентная база знаний проекта.
- **ORCH-25** декомпозиция эпиков (фича→подзадачи→сборка).
- **ORCH-27** code-coverage гейт.
- **ORCH-28** опциональная человеческая приёмка.
**Кандидаты-задачи M2:**
- **M2.1 Стеки-плагины:** формализовать «профиль стека» (web/mobile/data/ML) → агенты адаптируют процесс под стек. Расширяемо без правки ядра.
- **M2.2 Интерактивный аналитик** (ORCH-18): диалог Слава↔analyst для уточнения BRD + согласования макетов до старта.
- **M2.3 UX/UI слой** (ORCH-14): дизайнер-агент генерит макеты на аналитике.
- **M2.4 Тяжёлые вычисления** (ORCH-12): стадия/воркер для долгих расчётов вне основного цикла.
- **M2.5 База знаний проекта** (ORCH-24): RAG-контекст решений/архитектуры для агентов (меньше «слепого сканирования» = ещё и экономия).
- **M2.6 Декомпозиция эпиков** (ORCH-25): автоматический разбор эпика на задачи (этот документ — кандидат №1 на проверку).
---
## 5. МОДУЛЬ M3 — 💰 Экономика
**Backlog-фундамент:** ORCH-20 (оценка), ORCH-23 (бюджет circuit-breaker), ORCH-38 (контроль токенов), ORCH-19 (дешёвый трек багфикса), ORCH-92 (промпт-аудит, done — частично эффорт).
**Боль (факт из ORCH-38):** developer сжёг **$13.68 на мелкую задачу** (cache_read 18.98M — слепое сканирование src/). Стоимость линейно зависит от перечитывания контекста.
**Кандидаты-задачи M3:**
- **M3.1 Model routing cascade** (мир: 87%): классификатор сложности (trivial/small/medium/complex) → дешёвая модель на простое, opus только на сложное (ORCH-20 шаг 2 + ORCH-13). Роутер-модель дешёвая.
- **M3.2 Бюджет circuit-breaker** (ORCH-23): хард-лимит $/токенов/времени на задачу/стадию → пауза+алерт при превышении. Защита по факту.
- **M3.3 Оценка задачи ДО старта** (ORCH-20 шаг 1): прогноз $/время по истории похожих → Слава видит до запуска.
- **M3.4 Целевые файлы в задании** (ORCH-38): analyst кладёт точный список файлов из TRZ → агент не сканирует вслепую (главный пожиратель cache_read). **Самый дешёвый высокоэффективный фикс.**
- **M3.5 Fast-track для простых задач** (ORCH-19): багфикс/тривиал → урезанный цикл (без architect, дешёвая модель) вместо полного 6-стадийного.
- **M3.6 Эффорт-дисциплина** (на базе ORCH-92): per-stage effort, дешёвые модели на механику.
- **M3.7 Semantic caching / prompt compression** (мир: 31%): кэш повторяющихся контекстов, сжатие промптов.
- **M3.8 Cost-дашборд + аномалии** (связь M0): $/repo×agent, детект выбросов (как ORCH-16 поймали).
---
## 6. МОДУЛЬ M4 — 📈 Масштабируемость
**Backlog-фундамент:** ORCH-9 (онбординг проектов turnkey), ORCH-10 (тиражирование на др. хост), ORCH-88 (пакетный режим, done — serial), ORCH-6 (multi-repo, done).
**Текущее ограничение:** `max_concurrency=1` (serial-gate ORCH-88) — задачи идут по одной. Это сознательно для надёжности на этапе становления, но потолок масштаба.
**Кандидаты-задачи M4:**
- **M4.1 Параллельная разработка** (снять max_concurrency=1): безопасный N>1 (изоляция worktree уже есть ORCH-2; нужен merge-orchestration FIFO, защита от гонок main). Много фич параллельно.
- **M4.2 Turnkey онбординг проекта** (ORCH-9): один скрипт/команда → Plane-проект + Gitea-репо + агенты + инфра. Минута вместо часов.
- **M4.3 Тиражирование на новый хост** (ORCH-10): перенос всей платформы на инфру нового заказчика (IaC/compose-bundle).
- **M4.4 Per-repo масштаб ресурсов:** разные лимиты concurrency/бюджета на проект.
- **M4.5 Горизонтальный воркер-пул:** очередь jobs уже есть (ORCH-1) → несколько воркеров/хостов тянут одну очередь.
- **M4.6 Мультитенантность:** изоляция заказчиков (БД/секреты/доступы) для SaaS-сценария.
---
## 7. МОДУЛЬ M0 — 🧭 Управление саморазвитием (мета-контур)
> Это «мозг» эпика. Без него M1-M4 — просто список задач. M0 = ПЕТЛЯ, которая их генерит, приоритизирует и контролирует. Ядро = **ORCH-8**.
### 7.1 Петля самообучения (ORCH-8)
```
ДЕТЕКЦИЯ отклонения → ЖУРНАЛ урока (машинный) → АНАЛИЗ/паттерны → ПРЕДЛОЖЕНИЕ задачи → [SAFETY-ГЕЙТ] → конвейер (ORCH-7) → проверка эффекта → обновление журнала
┌─────────────────────────────────────────────────────────────┐
│ ВЕРТИКАЛЬ-ДВИГАТЕЛЬ 🧠 ВЕРТИКАЛЬ-ТОРМОЗ 🛑 │
│ петля обучения ORCH-8 governance / safety L0-L3 │
│ (генерит улучшения) (ограничивает, апрувы) │
│ ░░░░░░░░░░░░ проходят СКВОЗЬ все домены ░░░░░░░░░░░░░░░░░░░░░ │
├─────────────────────────────────────────────────────────────┤
│ ДОМЕНЫ РАЗВИТИЯ (равноценные, две руки роста) │
│ │
│ КРЕПНЕТ ───────────────────► РАЗДАЁТСЯ ВШИРЬ ────────► │
│ 🛡️ D1 Надёжность 🚀 D4 Возможности (фичи) │
│ ✅ D2 Качество/Доверие 📈 D5 Масштаб │
│ 💰 D3 Экономика │
├─────────────────────────────────────────────────────────────┤
│ ФУНДАМЕНТ (слой 0): 👁️ Наблюдаемость + 📒 Журнал уроков │
│ глаза и память — без них всё слепо │
└─────────────────────────────────────────────────────────────┘
Общая метрика-объединитель: 🌡️ ГРАДУСНИК АВТОНОМНОСТИ
(каждый домен двигает её вверх контролируемо)
```
- **Детекция:** провал гейта, **ручное вмешательство человека (самый ценный сигнал — каждый ручной пинок = дыра автономности)**, ретраи/откаты/таймауты, ложные срабатывания, «деплой OK, прод сломан».
- **Журнал:** структурированный (тип, контекст задача/стадия/агент, корень, предложение, статус) — НЕ свободный текст. Формализовать то, что сейчас в memory/.
- **Анализ:** гибрид (склонение Стрим) — машина копит и предлагает черновик → Стрим фильтрует/оформляет → Слава апрувит.
### 7.2 Safety-модель (КЛЮЧЕВОЕ — «контроль и управление»)
**Принцип (ORCH-8, незыблемо):** самомодификация платформы (промпты/скиллы/конфиги агентов/ядро) — **ТОЛЬКО через PR + ревью + апрув Славы**. Никаких авто-правок в рантайме без человека в петле. Оркестратор ПРЕДЛАГАЕТ, ПРИМЕНЯЕТ через свой же конвейер с гейтами.
### Что изменилось против v1 (мои же правки по критике)
- **Наблюдаемость вынесена в фундамент** (была внутри M1) — она питает ВСЁ.
- **M0 разбит на 2 вертикали:** двигатель (петля) и тормоз (governance) — у них противоположная логика, нельзя в одну коробку.
- **Добавлен домен D2 Качество/Доверие** — была дыра: надёжная платформа может стабильно генерить говнокод. Надёжность инфры ≠ корректность результата.
- **Рост (D4+D5) — равноценные домены, не «второй эшелон»** (коррекция Славы).
- **Градусник автономности** — сквозная измеримая цель вместо абстракции.
**Уровни автономии (по зрелости, agentic AIOps):**
| Уровень | Что можно авто | Гейт |
|---------|----------------|------|
---
## 2. ФУНДАМЕНТ (слой 0) — 👁️ Глаза и 📒 Память
Без данных нечем ни чинить, ни считать, ни приоритизировать, ни учиться. Строится первым.
- **F1 Наблюдаемость** (ORCH-83 [ЭПИК]): метрики agent-liveness + очередь + стадии + хост (диск/память/CPU) + контейнеры + внешние деп (Plane/Gitea/Anthropic). Эндпоинты /health /status /queue → расширить до /metrics + дашборд.
- **F2 Журнал уроков** (ORCH-8 шаг 1): машинная структурированная таблица отклонений (тип, контекст, корень, предложение, статус) — формализовать то, что сейчас в memory/. Это «топливо» для вертикали-двигателя.
---
## 3. ДОМЕН D1 — 🛡️ Надёжность (Self-Repairing)
**Есть:** reconciler (53), post-deploy monitor+rollback (21), merge-verify (71/73), reaper (65), disk-watchdog (63), build-prune (62).
**Уроки:** фантом-merge, deploy-петли, транзиенты, флапп-статусы, зомби-jobs.
- **D1.1** Предиктивный мониторинг (causal, не порог): «диск заполнится через N ч».
- **D1.2** Авто-ремедиация рантайма: каталог типовых фиксов (зомби-job→requeue, stale-lease→reclaim, флапп→форс-терминал).
- **D1.3** Транзиент-резилентность everywhere (обобщение ORCH-93): единый retry+backoff для всех внешних вызовов.
- **D1.4** Zero-downtime деплой платформы (blue-green/canary): резервное плечо вместо окна недоступности.
- **D1.5** Авто-rollback по SLO (расширение 21): откат по деградации latency/error-rate, не только health.
- **D1.6** Deep agent-liveness (self-healing LLM): «думает / завис / зациклился» по reasoning+CPU+прогрессу.
- **D1.7** Backup/restore БД+worktree (recovery после краша хоста).
---
## 4. ДОМЕН D2 — ✅ Качество / Доверие результата
> Новый домен. Закрывает дыру: платформа может надёжно и дёшево производить плохой результат. Надёжность инфры ≠ корректность кода/аналитики.
**Есть:** security-гейт (22), reviewer/tester стадии, промпт-аудит (92).
- **D2.1** Code-coverage гейт (ORCH-27): защита от деградации покрытия.
- **D2.2** Регресс-страж результата: не только «тесты зелёные», но «не сломали соседнюю фичу» (расширение regression-guard ORCH-73).
- **D2.3** Качество аналитики: метрика «BRD не пришлось переделывать», сверка факт vs ТЗ (как сегодня ловила ложное P0).
- **D2.4** Доверие к выходу: provenance артефактов, воспроизводимость, «деплой OK = прод реально работает» (урок ET-8).
- **D2.5** Опциональная человеческая приёмка важных фич (ORCH-28).
- **D2.6** Само-оценка агентов: уверенность в результате → эскалация при низкой.
---
## 5. ДОМЕН D3 — 💰 Экономика
**Боль (ORCH-38):** developer сжёг **$13.68 на мелочь** (cache_read 18.98M — слепое сканирование src/).
- **D3.1** Model-routing cascade (мир: 87%): классификатор сложности → дешёвая модель на простое, opus на сложное (ORCH-20+13).
- **D3.2** Бюджет circuit-breaker (ORCH-23): хард-лимит $/токенов/времени → пауза+алерт.
- **D3.3** Оценка задачи ДО старта (ORCH-20): прогноз $/время по истории.
- **D3.4** Целевые файлы в задании (ORCH-38): analyst даёт точный список из TRZ → нет слепого сканирования. **Самый дешёвый высокий impact.**
- **D3.5** Fast-track простых задач (ORCH-19): багфикс → урезанный цикл без architect, дешёвая модель.
- **D3.6** Semantic caching / prompt compression (мир: 31%).
- **D3.7** Cost-дашборд + детект аномалий.
---
## 6. ДОМЕН D4 — 🚀 Возможности (рост функционала)
> **Равноценный домен (акцент Славы).** Это то, ради чего платформой ПОЛЬЗУЮТСЯ. Без новых возможностей надёжность бессмысленна — нечего надёжно делать. Развивается параллельно с D1-D3, а не после.
**Backlog-зародыши:** ORCH-12/13/14/15/18/24/25.
- **D4.1** Стеки-плагины: профили стека (web/mobile/data/ML/embedded) → агенты адаптируют процесс. Расширяемо без правки ядра. **Открывает заказчикам новые типы проектов.**
- **D4.2** Android/мобильный стек (ORCH-15): полноценная разработка приложений.
- **D4.3** UX/UI-дизайнер (ORCH-14): дизайнер-агент генерит макеты на аналитике, согласование с BRD.
- **D4.4** Интерактивный аналитик (ORCH-18): живой диалог Слава↔analyst — уточнение BRD, обсуждение вариантов до старта. Удобство + качество постановки.
- **D4.5** Тяжёлые вычисления (ORCH-12): воркер/стадия для долгих расчётов (ML-обучение, миграции данных).
- **D4.6** База знаний проекта (ORCH-24): RAG-контекст решений/архитектуры — агенты умнее (+экономия).
- **D4.7** Декомпозиция эпиков (ORCH-25): эпик→задачи→сборка автоматически (этот документ — кандидат №1).
- **D4.8** Новые роли-агенты: data-engineer, ML-инженер, DevOps — по мере типов проектов.
- **D4.9** Мультипровайдерность моделей (ORCH-13): не только Claude — выбор под задачу/стек/бюджет.
---
## 7. ДОМЕН D5 — 📈 Масштаб
> Вторая «рука роста»: способность делать БОЛЬШЕ и ШИРЕ. Сейчас потолок — `max_concurrency=1`.
**Backlog-зародыши:** ORCH-9/10; done: ORCH-6 (multi-repo), ORCH-88 (serial-batch).
- **D5.1** Параллельная разработка (снять max_concurrency=1): безопасный N>1 (изоляция worktree есть, нужна merge-orchestration FIFO + защита main). **Много фич параллельно = быстрее растём.**
- **D5.2** Turnkey-онбординг проекта (ORCH-9): команда → Plane+Gitea+агенты+инфра за минуты.
- **D5.3** Тиражирование на новый хост (ORCH-10): перенос платформы на инфру нового заказчика (IaC-bundle).
- **D5.4** Горизонтальный воркер-пул: очередь jobs (ORCH-1) → несколько воркеров/хостов.
- **D5.5** Per-project лимиты ресурсов (concurrency/бюджет на проект).
- **D5.6** Мультитенантность (отложено — SaaS-сценарий, по спросу).
---
## 8. ВЕРТИКАЛЬ-ДВИГАТЕЛЬ 🧠 — петля самообучения (ORCH-8)
Проходит сквозь ВСЕ домены: генерит для каждого кандидаты-улучшения.
```
ДЕТЕКЦИЯ → ЖУРНАЛ урока → АНАЛИЗ/паттерны → ПРЕДЛОЖЕНИЕ задачи → [governance-гейт] → конвейер ORCH-7 → проверка эффекта → журнал
```
- **Детекция:** провал гейта, **ручное вмешательство (самый ценный сигнал — каждый ручной пинок = дыра автономности)**, ретраи/откаты/таймауты, ложные срабатывания, «деплой OK / прод сломан».
- **Анализ (гибрид):** машина копит и предлагает черновик → Стрим фильтрует/оформляет → Слава апрувит.
- **E1** Журнал уроков (=F2). **E2** Агент-ретроспективщик (анализ→предложение). **E3** Приоритизатор RICE (impact/cost/risk → что брать первым по всем доменам).
---
## 9. ВЕРТИКАЛЬ-ТОРМОЗ 🛑 — Governance / Safety
> «Контроль и управление саморазвитием» (требование Славы). Двигатель жмёт газ — этот контур держит руль и тормоз.
**Принцип (ORCH-8, незыблемо):** самомодификация платформы (промпты/скиллы/конфиги агентов/ядро) — ТОЛЬКО через PR+ревью+апрув Славы. Орк ПРЕДЛАГАЕТ, ПРИМЕНЯЕТ через свой конвейер с гейтами.
**Уровни автономии (agentic AIOps maturity):**
| Уровень | Что авто | Гейт |
|---------|----------|------|
| L0 reactive | только алерт | человек делает всё |
| L1 assistive | предложить задачу+ТЗ (autoApprove/autoDeploy лейблы уже есть!) | человек апрувит запуск |
| L2 autonomous-bounded | сам гонит безопасные классы (бэкенд-фиксы) до прода | safety-гейты (CI/staging/regression) держат |
| L3 self-modifying | менять агентов/ядро | **всегда** PR+апрув Славы, никогда не авто |
| L1 assistive | предложить задачу+ТЗ | человек апрувит запуск |
| L2 autonomous-bounded | гонит безопасные классы (бэкенд-фиксы) до прода | safety-гейты CI/staging/regression |
| L3 self-modifying | менять агентов/ядро | **всегда** PR+апрув Славы, НИКОГДА не авто |
→ Текущие лейблы `autoApprove`/`autoDeploy` (ORCH-89) = уже механизм управления автономией per-task. M0 их обобщает в политику.
### 7.3 Управление и видимость
- **M0.1 Журнал уроков** (ORCH-8 шаг 1): машинная таблица отклонений + связь с задачами.
- **M0.2 Агент-ретроспективщик:** после задачи/по расписанию анализирует уроки → черновик предложения.
- **M0.3 Приоритизатор:** ранжирует кандидатов M1-M4 по impact/cost/risk (RICE-подобно). Что брать первым.
- **M0.4 Дашборд эволюции** (расширение ORCH-83): метрики 4 модулей в динамике — видно, развивается ли платформа и куда.
- **M0.5 Safety-политика автономии:** формализованные уровни L0-L3 + per-class правила (что орк может сам, что только через Славу).
- **M0.6 Контроль расходов на саморазвитие:** сам эпик не должен жечь бюджет бесконтрольно (связь M3).
- **G1** Safety-политика L0-L3 + per-class правила (что можно само, что только через Славу). Лейблы autoApprove/autoDeploy (ORCH-89) = уже зародыш.
- **G2** Бюджет на саморазвитие: лимит $/мес, чтобы контур не жёг бесконтрольно.
- **G3** Дашборд эволюции: метрики 5 доменов в динамике — видно, КУДА развивается платформа.
- **G4** Kill-switch петли: остановить самогенерацию задач одним флагом.
---
## 8. Связь с текущим Backlog (ничего не теряем)
## 10. 🌡️ Градусник автономности (сквозная метрика)
| Backlog-задача | Модуль | Действие |
|----------------|--------|----------|
| ORCH-8 петля самообучения | **M0** | ядро мета-контура |
| ORCH-83 наблюдаемость [ЭПИК] | **M1/M0** | фундамент мониторинга |
| ORCH-20 оценка задачи | M3 | M3.1/M3.3 |
| ORCH-23 бюджет breaker | M3 | M3.2 |
| ORCH-38 контроль токенов | M3 | M3.4/M3.8 |
| ORCH-19 дешёвый трек багов | M3 | M3.5 |
| ORCH-9 онбординг | M4 | M4.2 |
| ORCH-10 тиражирование | M4 | M4.3 |
| ORCH-12 тяжёлые расчёты | M2 | M2.4 |
| ORCH-13 мультипровайдер | M2/M3 | M2/роутер |
| ORCH-14 UX/UI | M2 | M2.3 |
| ORCH-15 Android | M2 | M2.1 |
| ORCH-18 интерактив-аналитик | M2 | M2.2 |
| ORCH-24 база знаний | M2 | M2.5 |
| ORCH-25 декомпозиция эпиков | M2/M0 | M2.6 |
| ORCH-27 coverage-гейт | M1 | надёжность |
| ORCH-28 человек-приёмка | M0 | safety |
| ORCH-94 флапп-статус | M1 | авто-ремедиация |
**Вывод:** ~18 backlog-задач уже ложатся в 4 модуля. Эпик их не заменяет — **систематизирует и достраивает** до связного контура с управляющим мозгом (M0).
Объединяющая измеримая цель эпика. Каждый домен двигает её вверх:
- **% задач без ручного пинка** (сегодня было ~5 вмешательств: апрувы, домерж 063, sync 061).
- **Ручных вмешательств / неделю** (тренд вниз).
- **MTBF / MTTR** платформы (D1).
- **$/задача, токены/задача, время/задача** (D3).
- **Типов проектов/стеков поддержано** (D4).
- **Задач параллельно** (D5).
- **% уроков, ставших задачами** (двигатель).
---
## 9. Дорожная карта (предложение)
## 11. Связь с Backlog (ничего не теряем)
1. **Фаза 0 (фундамент):** ORCH-83 наблюдаемость (M1) + ORCH-8 журнал уроков (M0). Без данных нечем рулить.
2. **Фаза 1 (быстрые победы экономики):** M3.4 целевые файлы + M3.2 бюджет-breaker + M3.1 роутер. Дешёвый высокий impact.
3. **Фаза 2 (надёжность):** M1.3 транзиент-резилентность + M1.2 авто-ремедиация + M1.1 предиктив.
4. **Фаза 3 (мета-контур):** M0.2 ретроспективщик + M0.3 приоритизатор + M0.5 safety-политика → петля замыкается.
5. **Фаза 4 (масштаб/расширение):** M4.1 параллелизм + M4.2 онбординг + M2.* по спросу заказчиков.
| Backlog | Домен/вертикаль |
|---------|-----------------|
| ORCH-8 петля | 🧠 Двигатель (ядро) |
| ORCH-83 наблюдаемость | Фундамент F1 |
| ORCH-20/23/38/19 | 💰 D3 |
| ORCH-27/28 | ✅ D2 |
| ORCH-12/13/14/15/18/24/25 | 🚀 D4 |
| ORCH-9/10 | 📈 D5 |
| ORCH-94 флапп | 🛡️ D1.2 |
| ORCH-89 авто-лейблы | 🛑 G1 |
~18 backlog-задач ложатся в структуру. Эпик их систематизирует и достраивает.
---
## 10. Открытые вопросы Славе (до декомпозиции)
## 12. Дорожная карта (предложение)
1. **Структура в Plane:** один мега-эпик ORCH-XX с 5 под-эпиками (M0-M4)? Или 5 отдельных эпиков? (Plane API v1 не умеет relations — иерархию ведём в доке + префиксах названий.)
2. **Safety-модель L0-L3:** согласен, что L3 (самомодификация агентов/ядра) — ВСЕГДА через твой апрув, без авто? Или где-то хочешь выше автономность?
3. **Приоритет модулей:** мой порядок Фаза0→экономика→надёжность→мета→масштаб. Согласен, или сначала масштаб (параллелизм)?
4. **Агент-ретроспективщик (M0.2):** заводить как агента в конвейере сразу, или сначала Стрим вручную ведёт журнал и предлагает?
5. **Бюджет на сам эпик:** лимит $/мес на саморазвитие, чтобы контур не жёг бесконтрольно?
6. **Первая задача:** с чего стартуем после апрува концепции — ORCH-83 (видимость) или быстрая победа M3.4 (целевые файлы, −стоимость сразу)?
1. **Фаза 0 (фундамент):** F1 наблюдаемость + F2 журнал. Без них рулить нечем.
2. **Фаза 1 (две руки параллельно):**
- крепнем: D3.4 целевые файлы + D3.2 бюджет-breaker (дешёвый impact)
- растём: D4.1 стеки-плагины ИЛИ D4.4 интерактив-аналитик (по спросу)
3. **Фаза 2:** D1 надёжность (транзиент-резилентность, авто-ремедиация) + D2 качество + D5.1 параллелизм.
4. **Фаза 3 (мозг):** E2 ретроспективщик + E3 приоритизатор + G1 safety-политика → петля замыкается, дальше платформа предлагает сама.
---
## 13. Открытые вопросы Славе
1. **Структура Plane:** мега-эпик с фундаментом+5 доменами+2 вертикалями? Или эпик на каждый домен?
2. **D4 (возможности):** какой стек/фича приоритетны для тебя/заказчиков — Android, UX/UI, тяжёлые расчёты, интерактив-аналитик? С чего рост начинать?
3. **Баланс «крепнем vs растём»:** идти строго параллельно обеими руками, или в каждой фазе перевес в одну сторону?
4. **Safety L3:** подтверждаешь — самомодификация ядра/агентов всегда через твой апрув?
5. **Ретроспективщик (E2):** агент сразу, или сначала Стрим вручную ведёт журнал?
6. **Бюджет на эпик (G2):** лимит $/мес?
7. **Первая задача** после апрува: F1 наблюдаемость, быстрая победа D3.4, или сразу рост D4.*?