From 8a67f15eaa85f4099de1db1e0e5cfd1694872e66 Mon Sep 17 00:00:00 2001 From: Stream Date: Tue, 9 Jun 2026 22:10:01 +0300 Subject: [PATCH] auto-sync: 2026-06-09 22:10:01 --- memory/2026-06-09.md | 10 + .../EPIC_AUTONOMOUS_SELF_EVOLUTION.md | 358 +++++++++--------- 2 files changed, 196 insertions(+), 172 deletions(-) diff --git a/memory/2026-06-09.md b/memory/2026-06-09.md index 1abc8d1..4bcd16b 100644 --- a/memory/2026-06-09.md +++ b/memory/2026-06-09.md @@ -226,3 +226,13 @@ - **Мир-практики:** STRATUS NeurIPS'25 (мультиагент SRE), ChaosEater ASE'25, self-healing LLM-agents arXiv'26, causal AIOps Stanford, model-routing −87%/semantic-caching −31%, FinOps guardrails. - **6 открытых вопросов Славе** в доке (структура Plane, safety L3, приоритет фаз, ретроспективщик сразу/потом, бюджет на эпик, первая задача). - ⏳ Ждёт апрува концепции → потом декомпозиция в задачи Plane. НЕ заводила задачи (концепция первая). + +## 🧬→v2 Концепция эпика ПЕРЕСМОТРЕНА (Слава: «беру твоё предложение за основу + рост фич очень нужен», 09.06 ~19:02 MSK) +- Слава попросил критику моей же схемы → дала честную (пересечения модулей, наблюдаемость зря в M1, M0=мозг недооценён, нет оси КАЧЕСТВА). Слава: берём за основу, НО саморазвитие — не только стабильность/качество, **рост фич равноценен**. +- **Переписала документ v2** (структура: фундамент + 5 доменов + 2 вертикали): + - **Фундамент (слой 0):** F1 наблюдаемость (ORCH-83) + F2 журнал уроков (ORCH-8 шаг1). + - **5 доменов (равноценны, «две руки роста»):** D1 Надёжность / D2 Качество-Доверие (НОВЫЙ — надёжная платформа ≠ корректный результат) / D3 Экономика / **D4 Возможности-фичи (равноценный, акцент Славы — не второй эшелон!)** / D5 Масштаб. + - **2 вертикали сквозь всё:** Двигатель (петля ORCH-8) + Тормоз (governance/safety L0-L3). + - **Градусник автономности** — сквозная метрика. +- **Ключевая правка Славы:** D4 (Android/UX-UI/интерактив-аналитик/тяжёлые расчёты/стеки-плагины/база знаний) + D5 — РАВНОЦЕННЫ надёжности, параллельно, не после. «Стабильная платформа без роста = тупик». +- 7 вопросов Славе. Документ: EPIC_AUTONOMOUS_SELF_EVOLUTION.md (v2, 12.8КБ). Ждёт финального апрува → декомпозиция. diff --git a/tasks/orchestrator/EPIC_AUTONOMOUS_SELF_EVOLUTION.md b/tasks/orchestrator/EPIC_AUTONOMOUS_SELF_EVOLUTION.md index cda82da..42ec7cd 100644 --- a/tasks/orchestrator/EPIC_AUTONOMOUS_SELF_EVOLUTION.md +++ b/tasks/orchestrator/EPIC_AUTONOMOUS_SELF_EVOLUTION.md @@ -1,6 +1,6 @@ # 🧬 ЭПИК: Автономное саморазвитие платформы оркестратора -> **Статус:** концепция (для апрува Славы → декомпозиция в задачи) +> **Статус:** концепция v2 (структура согласована Славой 09.06 → ждёт финального апрува → декомпозиция) > **Автор:** Стрим · **Дата:** 2026-06-09 · **Заказчик:** Слава > **Связанные:** ORCH-8 (петля самообучения), ORCH-83 (наблюдаемость), ORCH-54 (автономное внедрение, done) > **Источники:** память орка (инциденты 06–09.06), инвентаризация 94 задач Plane, мировые практики (STRATUS NeurIPS'25, ChaosEater ASE'25, self-healing LLM-agents arXiv'26, agentic AIOps, FinOps token-economics). @@ -9,198 +9,212 @@ ## 0. Зачем это (vision) -Оркестратор уже **автономно внедряет** (ORCH-54 достигнут: задача проходит analysis→prod без человека). Но автономность исполнения ≠ автономное **развитие**. Сегодня платформу развивает связка Слава+Стрим вручную: ловим инциденты → формулируем уроки → заводим задачи → апрувим. +Оркестратор уже **автономно внедряет** (ORCH-54: задача проходит analysis→prod без человека). Но автономность исполнения ≠ автономное **развитие**. Сегодня платформу развивает связка Слава+Стрим вручную: ловим инциденты → формулируем уроки → заводим задачи → апрувим. -**Цель эпика:** превратить это в управляемый самоподдерживающийся контур, где платформа сама: -- замечает свои слабые места (надёжность, стоимость, узкие места), -- предлагает улучшения как готовые задачи, -- проводит их через собственный конвейер (ORCH-7 self-hosting), -- **под контролем человека на ключевых развилках** (safety > автономность). +**Цель эпика:** управляемый самоподдерживающийся контур, где платформа сама замечает свои слабые места И возможности роста, предлагает улучшения как готовые задачи, проводит их через собственный конвейер (ORCH-7 self-hosting) — **под контролем человека на ключевых развилках** (safety > автономность). -Эпик делится на **4 модуля развития** + **1 управляющий контур** (мета-слой, который рулит первыми четырьмя). +**Принцип баланса (коррекция Славы 09.06):** саморазвитие — это НЕ только «не падать и не косячить». Стабильная платформа, которая не растёт в возможностях, — тупик. **Рост функционала (новые фичи, стеки, удобства для заказчиков) — равноценный домен, а не следствие надёжности.** Платформа развивается по двум рукам одновременно: крепнет (надёжность/качество/экономика) И раздаётся вширь (возможности/масштаб). --- -## 1. Принцип деления (по Славе) +## 1. Архитектура эпика: фундамент + 5 доменов + 2 вертикали -| # | Модуль | Суть | Метрика успеха | -|---|--------|------|----------------| -| **M1** | 🛡️ **Self-Repairing** (надёжность) | Стабильность, отказоустойчивость, производительность БЕЗ потери функциональности | MTBF↑, MTTR↓, % автономных задач без ручного пинка↑ | -| **M2** | 🚀 **Расширение функционала** | Новые возможности для заказчиков: стеки, фичи, удобства | число поддержанных типов проектов/стеков↑ | -| **M3** | 💰 **Экономика** | Оптимизация $/токенов/времени/ресурсов на задачу + контроль расходов | $/задача↓, токены/задача↓, время/задача↓ при том же качестве | -| **M4** | 📈 **Масштабируемость** | Параллелизм, онбординг проектов, перенос на новую инфру | задач параллельно↑, время онбординга проекта↓ | -| **M0** | 🧭 **Управление саморазвитием** | Мета-контур: петля обучения, приоритизация, safety-гейты, дашборд эволюции | покрытие уроков→задачами↑, 0 неконтролируемых самоизменений | - ---- - -## 2. Мировые практики (что берём) - -- **STRATUS (NeurIPS'25)** — мультиагентная автономная reliability-инженерия облака: агенты-расследователи + remediation с гарантиями безопасности. → паттерн для M1 (агент-SRE). -- **ChaosEater (ASE'25)** — автоматизация chaos-engineering через LLM. → M1: периодически инъецировать сбои в staging, проверять самовосстановление. -- **Self-Healing LLM-agents (arXiv 2026)** — мониторинг ВНУТРЕННЕГО reasoning агента + внешних результатов исполнения. → M0/M1: liveness не только по pid, но по «думает ли осмысленно». -- **Agentic AIOps (LogicMonitor/Deimos 2025-26)** — зрелость: reactive→assistive→autonomous; «humans still press enter» на критичном. → M0 safety-модель. -- **Causal AIOps (Stanford NeurIPS'25)** — предсказание сбоев плато на ~90% без причинно-следственного вывода. → M1 предиктивный мониторинг = causal, не только корреляция. -- **Model routing cascades (−87% стоимости)** + **semantic caching (−31%)** + **prompt compression (LLMLingua)** + **runtime token governance** (TechTarget'26). → прямо в M3. -- **FinOps guardrails** (Flexera/Amnic 2026): автономные cost-гардрейлы, бюджет-aware решения, аномалии расходов. → M3 + M0. - ---- - -## 3. МОДУЛЬ M1 — 🛡️ Self-Repairing (надёжность) - -**Что уже есть (фундамент):** reconciler (ORCH-53), post-deploy monitor+rollback (ORCH-21), merge-verify (ORCH-71/73), job-reaper+stale-lease (ORCH-65), security-гейт (ORCH-22), disk-watchdog (ORCH-63), build-cache-prune (ORCH-62). - -**Уроки из истории, которые M1 закрывает системно:** -- Фантом-merge (08.06): прод расходился с main, 4 PR не слиты → накопительная потеря кода. -- Deploy-петля (06–07.06): bootstrap-парадокс, ложный staging FAIL. -- Транзиенты (09.06): Anthropic Overloaded (отретраился) + Gitea 405 (не отретраился → ложный HOLD). -- Флаппинг статусов (09.06, ORCH-94): done-задача дёргает deploy-статусы вечно. -- Зомби-jobs/merge-lease залип (06.06). - -**Кандидаты-задачи M1:** -- **M1.1 Предиктивный мониторинг** (на базе ORCH-83): time-series по диску/памяти/очереди → алерт ДО исчерпания (causal, не только порог). Прогноз «диск заполнится через N часов». -- **M1.2 Авто-ремедиация рантайма** (расширение reconciler): типовые сбои чинятся сами по runbook (зомби-job→requeue, stale-lease→reclaim, флапп-статус→форс-терминал). Каталог авто-фиксов. -- **M1.3 Транзиент-резилентность everywhere** (обобщение ORCH-93): единый retry-with-backoff слой для ВСЕХ внешних вызовов (Gitea/Plane/Anthropic) — breaker-паттерн как у агентов. -- **M1.4 Zero-downtime деплой** платформы: blue-green/canary для self-hosting (сейчас рестарт = окно недоступности). Резервное плечо. -- **M1.5 Авто-rollback по SLO** (расширение ORCH-21): не только health-check, но деградация метрик (latency/error-rate) → откат. -- **M1.6 Chaos-в-staging** (ChaosEater-паттерн): периодически ломать staging, проверять что monitor+rollback ловят. -- **M1.7 Agent-liveness deep** (self-healing LLM): детект «агент думает vs завис vs зациклился» по reasoning+CPU+прогрессу (урок: analyst завис 22 мин, лезли в /proc). -- **M1.8 Backup/restore** БД орка + worktree-state (durable recovery после краша хоста). - ---- - -## 4. МОДУЛЬ M2 — 🚀 Расширение функционала - -**Backlog уже содержит зародыши:** -- **ORCH-12** тяжёлые миграции/расчёты (опциональная стадия). -- **ORCH-14/18** UX/UI дизайнер + интерактивный аналитик (живой диалог, макеты). -- **ORCH-15** Android-приложения (мобильный стек). -- **ORCH-13** мультипровайдерность LLM (Claude+OpenRouter+др). -- **ORCH-24** персистентная база знаний проекта. -- **ORCH-25** декомпозиция эпиков (фича→подзадачи→сборка). -- **ORCH-27** code-coverage гейт. -- **ORCH-28** опциональная человеческая приёмка. - -**Кандидаты-задачи M2:** -- **M2.1 Стеки-плагины:** формализовать «профиль стека» (web/mobile/data/ML) → агенты адаптируют процесс под стек. Расширяемо без правки ядра. -- **M2.2 Интерактивный аналитик** (ORCH-18): диалог Слава↔analyst для уточнения BRD + согласования макетов до старта. -- **M2.3 UX/UI слой** (ORCH-14): дизайнер-агент генерит макеты на аналитике. -- **M2.4 Тяжёлые вычисления** (ORCH-12): стадия/воркер для долгих расчётов вне основного цикла. -- **M2.5 База знаний проекта** (ORCH-24): RAG-контекст решений/архитектуры для агентов (меньше «слепого сканирования» = ещё и экономия). -- **M2.6 Декомпозиция эпиков** (ORCH-25): автоматический разбор эпика на задачи (этот документ — кандидат №1 на проверку). - ---- - -## 5. МОДУЛЬ M3 — 💰 Экономика - -**Backlog-фундамент:** ORCH-20 (оценка), ORCH-23 (бюджет circuit-breaker), ORCH-38 (контроль токенов), ORCH-19 (дешёвый трек багфикса), ORCH-92 (промпт-аудит, done — частично эффорт). - -**Боль (факт из ORCH-38):** developer сжёг **$13.68 на мелкую задачу** (cache_read 18.98M — слепое сканирование src/). Стоимость линейно зависит от перечитывания контекста. - -**Кандидаты-задачи M3:** -- **M3.1 Model routing cascade** (мир: −87%): классификатор сложности (trivial/small/medium/complex) → дешёвая модель на простое, opus только на сложное (ORCH-20 шаг 2 + ORCH-13). Роутер-модель дешёвая. -- **M3.2 Бюджет circuit-breaker** (ORCH-23): хард-лимит $/токенов/времени на задачу/стадию → пауза+алерт при превышении. Защита по факту. -- **M3.3 Оценка задачи ДО старта** (ORCH-20 шаг 1): прогноз $/время по истории похожих → Слава видит до запуска. -- **M3.4 Целевые файлы в задании** (ORCH-38): analyst кладёт точный список файлов из TRZ → агент не сканирует вслепую (главный пожиратель cache_read). **Самый дешёвый высокоэффективный фикс.** -- **M3.5 Fast-track для простых задач** (ORCH-19): багфикс/тривиал → урезанный цикл (без architect, дешёвая модель) вместо полного 6-стадийного. -- **M3.6 Эффорт-дисциплина** (на базе ORCH-92): per-stage effort, дешёвые модели на механику. -- **M3.7 Semantic caching / prompt compression** (мир: −31%): кэш повторяющихся контекстов, сжатие промптов. -- **M3.8 Cost-дашборд + аномалии** (связь M0): $/repo×agent, детект выбросов (как ORCH-16 поймали). - ---- - -## 6. МОДУЛЬ M4 — 📈 Масштабируемость - -**Backlog-фундамент:** ORCH-9 (онбординг проектов turnkey), ORCH-10 (тиражирование на др. хост), ORCH-88 (пакетный режим, done — serial), ORCH-6 (multi-repo, done). - -**Текущее ограничение:** `max_concurrency=1` (serial-gate ORCH-88) — задачи идут по одной. Это сознательно для надёжности на этапе становления, но потолок масштаба. - -**Кандидаты-задачи M4:** -- **M4.1 Параллельная разработка** (снять max_concurrency=1): безопасный N>1 (изоляция worktree уже есть ORCH-2; нужен merge-orchestration FIFO, защита от гонок main). Много фич параллельно. -- **M4.2 Turnkey онбординг проекта** (ORCH-9): один скрипт/команда → Plane-проект + Gitea-репо + агенты + инфра. Минута вместо часов. -- **M4.3 Тиражирование на новый хост** (ORCH-10): перенос всей платформы на инфру нового заказчика (IaC/compose-bundle). -- **M4.4 Per-repo масштаб ресурсов:** разные лимиты concurrency/бюджета на проект. -- **M4.5 Горизонтальный воркер-пул:** очередь jobs уже есть (ORCH-1) → несколько воркеров/хостов тянут одну очередь. -- **M4.6 Мультитенантность:** изоляция заказчиков (БД/секреты/доступы) для SaaS-сценария. - ---- - -## 7. МОДУЛЬ M0 — 🧭 Управление саморазвитием (мета-контур) - -> Это «мозг» эпика. Без него M1-M4 — просто список задач. M0 = ПЕТЛЯ, которая их генерит, приоритизирует и контролирует. Ядро = **ORCH-8**. - -### 7.1 Петля самообучения (ORCH-8) ``` -ДЕТЕКЦИЯ отклонения → ЖУРНАЛ урока (машинный) → АНАЛИЗ/паттерны → ПРЕДЛОЖЕНИЕ задачи → [SAFETY-ГЕЙТ] → конвейер (ORCH-7) → проверка эффекта → обновление журнала +┌─────────────────────────────────────────────────────────────┐ +│ ВЕРТИКАЛЬ-ДВИГАТЕЛЬ 🧠 ВЕРТИКАЛЬ-ТОРМОЗ 🛑 │ +│ петля обучения ORCH-8 governance / safety L0-L3 │ +│ (генерит улучшения) (ограничивает, апрувы) │ +│ ░░░░░░░░░░░░ проходят СКВОЗЬ все домены ░░░░░░░░░░░░░░░░░░░░░ │ +├─────────────────────────────────────────────────────────────┤ +│ ДОМЕНЫ РАЗВИТИЯ (равноценные, две руки роста) │ +│ │ +│ КРЕПНЕТ ───────────────────► РАЗДАЁТСЯ ВШИРЬ ────────► │ +│ 🛡️ D1 Надёжность 🚀 D4 Возможности (фичи) │ +│ ✅ D2 Качество/Доверие 📈 D5 Масштаб │ +│ 💰 D3 Экономика │ +├─────────────────────────────────────────────────────────────┤ +│ ФУНДАМЕНТ (слой 0): 👁️ Наблюдаемость + 📒 Журнал уроков │ +│ глаза и память — без них всё слепо │ +└─────────────────────────────────────────────────────────────┘ + Общая метрика-объединитель: 🌡️ ГРАДУСНИК АВТОНОМНОСТИ + (каждый домен двигает её вверх контролируемо) ``` -- **Детекция:** провал гейта, **ручное вмешательство человека (самый ценный сигнал — каждый ручной пинок = дыра автономности)**, ретраи/откаты/таймауты, ложные срабатывания, «деплой OK, прод сломан». -- **Журнал:** структурированный (тип, контекст задача/стадия/агент, корень, предложение, статус) — НЕ свободный текст. Формализовать то, что сейчас в memory/. -- **Анализ:** гибрид (склонение Стрим) — машина копит и предлагает черновик → Стрим фильтрует/оформляет → Слава апрувит. -### 7.2 Safety-модель (КЛЮЧЕВОЕ — «контроль и управление») -**Принцип (ORCH-8, незыблемо):** самомодификация платформы (промпты/скиллы/конфиги агентов/ядро) — **ТОЛЬКО через PR + ревью + апрув Славы**. Никаких авто-правок в рантайме без человека в петле. Оркестратор ПРЕДЛАГАЕТ, ПРИМЕНЯЕТ через свой же конвейер с гейтами. +### Что изменилось против v1 (мои же правки по критике) +- **Наблюдаемость вынесена в фундамент** (была внутри M1) — она питает ВСЁ. +- **M0 разбит на 2 вертикали:** двигатель (петля) и тормоз (governance) — у них противоположная логика, нельзя в одну коробку. +- **Добавлен домен D2 Качество/Доверие** — была дыра: надёжная платформа может стабильно генерить говнокод. Надёжность инфры ≠ корректность результата. +- **Рост (D4+D5) — равноценные домены, не «второй эшелон»** (коррекция Славы). +- **Градусник автономности** — сквозная измеримая цель вместо абстракции. -**Уровни автономии (по зрелости, agentic AIOps):** -| Уровень | Что можно авто | Гейт | -|---------|----------------|------| +--- + +## 2. ФУНДАМЕНТ (слой 0) — 👁️ Глаза и 📒 Память + +Без данных нечем ни чинить, ни считать, ни приоритизировать, ни учиться. Строится первым. + +- **F1 Наблюдаемость** (ORCH-83 [ЭПИК]): метрики agent-liveness + очередь + стадии + хост (диск/память/CPU) + контейнеры + внешние деп (Plane/Gitea/Anthropic). Эндпоинты /health /status /queue → расширить до /metrics + дашборд. +- **F2 Журнал уроков** (ORCH-8 шаг 1): машинная структурированная таблица отклонений (тип, контекст, корень, предложение, статус) — формализовать то, что сейчас в memory/. Это «топливо» для вертикали-двигателя. + +--- + +## 3. ДОМЕН D1 — 🛡️ Надёжность (Self-Repairing) + +**Есть:** reconciler (53), post-deploy monitor+rollback (21), merge-verify (71/73), reaper (65), disk-watchdog (63), build-prune (62). +**Уроки:** фантом-merge, deploy-петли, транзиенты, флапп-статусы, зомби-jobs. + +- **D1.1** Предиктивный мониторинг (causal, не порог): «диск заполнится через N ч». +- **D1.2** Авто-ремедиация рантайма: каталог типовых фиксов (зомби-job→requeue, stale-lease→reclaim, флапп→форс-терминал). +- **D1.3** Транзиент-резилентность everywhere (обобщение ORCH-93): единый retry+backoff для всех внешних вызовов. +- **D1.4** Zero-downtime деплой платформы (blue-green/canary): резервное плечо вместо окна недоступности. +- **D1.5** Авто-rollback по SLO (расширение 21): откат по деградации latency/error-rate, не только health. +- **D1.6** Deep agent-liveness (self-healing LLM): «думает / завис / зациклился» по reasoning+CPU+прогрессу. +- **D1.7** Backup/restore БД+worktree (recovery после краша хоста). + +--- + +## 4. ДОМЕН D2 — ✅ Качество / Доверие результата + +> Новый домен. Закрывает дыру: платформа может надёжно и дёшево производить плохой результат. Надёжность инфры ≠ корректность кода/аналитики. + +**Есть:** security-гейт (22), reviewer/tester стадии, промпт-аудит (92). + +- **D2.1** Code-coverage гейт (ORCH-27): защита от деградации покрытия. +- **D2.2** Регресс-страж результата: не только «тесты зелёные», но «не сломали соседнюю фичу» (расширение regression-guard ORCH-73). +- **D2.3** Качество аналитики: метрика «BRD не пришлось переделывать», сверка факт vs ТЗ (как сегодня ловила ложное P0). +- **D2.4** Доверие к выходу: provenance артефактов, воспроизводимость, «деплой OK = прод реально работает» (урок ET-8). +- **D2.5** Опциональная человеческая приёмка важных фич (ORCH-28). +- **D2.6** Само-оценка агентов: уверенность в результате → эскалация при низкой. + +--- + +## 5. ДОМЕН D3 — 💰 Экономика + +**Боль (ORCH-38):** developer сжёг **$13.68 на мелочь** (cache_read 18.98M — слепое сканирование src/). + +- **D3.1** Model-routing cascade (мир: −87%): классификатор сложности → дешёвая модель на простое, opus на сложное (ORCH-20+13). +- **D3.2** Бюджет circuit-breaker (ORCH-23): хард-лимит $/токенов/времени → пауза+алерт. +- **D3.3** Оценка задачи ДО старта (ORCH-20): прогноз $/время по истории. +- **D3.4** Целевые файлы в задании (ORCH-38): analyst даёт точный список из TRZ → нет слепого сканирования. **Самый дешёвый высокий impact.** +- **D3.5** Fast-track простых задач (ORCH-19): багфикс → урезанный цикл без architect, дешёвая модель. +- **D3.6** Semantic caching / prompt compression (мир: −31%). +- **D3.7** Cost-дашборд + детект аномалий. + +--- + +## 6. ДОМЕН D4 — 🚀 Возможности (рост функционала) + +> **Равноценный домен (акцент Славы).** Это то, ради чего платформой ПОЛЬЗУЮТСЯ. Без новых возможностей надёжность бессмысленна — нечего надёжно делать. Развивается параллельно с D1-D3, а не после. + +**Backlog-зародыши:** ORCH-12/13/14/15/18/24/25. + +- **D4.1** Стеки-плагины: профили стека (web/mobile/data/ML/embedded) → агенты адаптируют процесс. Расширяемо без правки ядра. **Открывает заказчикам новые типы проектов.** +- **D4.2** Android/мобильный стек (ORCH-15): полноценная разработка приложений. +- **D4.3** UX/UI-дизайнер (ORCH-14): дизайнер-агент генерит макеты на аналитике, согласование с BRD. +- **D4.4** Интерактивный аналитик (ORCH-18): живой диалог Слава↔analyst — уточнение BRD, обсуждение вариантов до старта. Удобство + качество постановки. +- **D4.5** Тяжёлые вычисления (ORCH-12): воркер/стадия для долгих расчётов (ML-обучение, миграции данных). +- **D4.6** База знаний проекта (ORCH-24): RAG-контекст решений/архитектуры — агенты умнее (+экономия). +- **D4.7** Декомпозиция эпиков (ORCH-25): эпик→задачи→сборка автоматически (этот документ — кандидат №1). +- **D4.8** Новые роли-агенты: data-engineer, ML-инженер, DevOps — по мере типов проектов. +- **D4.9** Мультипровайдерность моделей (ORCH-13): не только Claude — выбор под задачу/стек/бюджет. + +--- + +## 7. ДОМЕН D5 — 📈 Масштаб + +> Вторая «рука роста»: способность делать БОЛЬШЕ и ШИРЕ. Сейчас потолок — `max_concurrency=1`. + +**Backlog-зародыши:** ORCH-9/10; done: ORCH-6 (multi-repo), ORCH-88 (serial-batch). + +- **D5.1** Параллельная разработка (снять max_concurrency=1): безопасный N>1 (изоляция worktree есть, нужна merge-orchestration FIFO + защита main). **Много фич параллельно = быстрее растём.** +- **D5.2** Turnkey-онбординг проекта (ORCH-9): команда → Plane+Gitea+агенты+инфра за минуты. +- **D5.3** Тиражирование на новый хост (ORCH-10): перенос платформы на инфру нового заказчика (IaC-bundle). +- **D5.4** Горизонтальный воркер-пул: очередь jobs (ORCH-1) → несколько воркеров/хостов. +- **D5.5** Per-project лимиты ресурсов (concurrency/бюджет на проект). +- **D5.6** Мультитенантность (отложено — SaaS-сценарий, по спросу). + +--- + +## 8. ВЕРТИКАЛЬ-ДВИГАТЕЛЬ 🧠 — петля самообучения (ORCH-8) + +Проходит сквозь ВСЕ домены: генерит для каждого кандидаты-улучшения. +``` +ДЕТЕКЦИЯ → ЖУРНАЛ урока → АНАЛИЗ/паттерны → ПРЕДЛОЖЕНИЕ задачи → [governance-гейт] → конвейер ORCH-7 → проверка эффекта → журнал +``` +- **Детекция:** провал гейта, **ручное вмешательство (самый ценный сигнал — каждый ручной пинок = дыра автономности)**, ретраи/откаты/таймауты, ложные срабатывания, «деплой OK / прод сломан». +- **Анализ (гибрид):** машина копит и предлагает черновик → Стрим фильтрует/оформляет → Слава апрувит. +- **E1** Журнал уроков (=F2). **E2** Агент-ретроспективщик (анализ→предложение). **E3** Приоритизатор RICE (impact/cost/risk → что брать первым по всем доменам). + +--- + +## 9. ВЕРТИКАЛЬ-ТОРМОЗ 🛑 — Governance / Safety + +> «Контроль и управление саморазвитием» (требование Славы). Двигатель жмёт газ — этот контур держит руль и тормоз. + +**Принцип (ORCH-8, незыблемо):** самомодификация платформы (промпты/скиллы/конфиги агентов/ядро) — ТОЛЬКО через PR+ревью+апрув Славы. Орк ПРЕДЛАГАЕТ, ПРИМЕНЯЕТ через свой конвейер с гейтами. + +**Уровни автономии (agentic AIOps maturity):** +| Уровень | Что авто | Гейт | +|---------|----------|------| | L0 reactive | только алерт | человек делает всё | -| L1 assistive | предложить задачу+ТЗ (autoApprove/autoDeploy лейблы уже есть!) | человек апрувит запуск | -| L2 autonomous-bounded | сам гонит безопасные классы (бэкенд-фиксы) до прода | safety-гейты (CI/staging/regression) держат | -| L3 self-modifying | менять агентов/ядро | **всегда** PR+апрув Славы, никогда не авто | +| L1 assistive | предложить задачу+ТЗ | человек апрувит запуск | +| L2 autonomous-bounded | гонит безопасные классы (бэкенд-фиксы) до прода | safety-гейты CI/staging/regression | +| L3 self-modifying | менять агентов/ядро | **всегда** PR+апрув Славы, НИКОГДА не авто | -→ Текущие лейблы `autoApprove`/`autoDeploy` (ORCH-89) = уже механизм управления автономией per-task. M0 их обобщает в политику. - -### 7.3 Управление и видимость -- **M0.1 Журнал уроков** (ORCH-8 шаг 1): машинная таблица отклонений + связь с задачами. -- **M0.2 Агент-ретроспективщик:** после задачи/по расписанию анализирует уроки → черновик предложения. -- **M0.3 Приоритизатор:** ранжирует кандидатов M1-M4 по impact/cost/risk (RICE-подобно). Что брать первым. -- **M0.4 Дашборд эволюции** (расширение ORCH-83): метрики 4 модулей в динамике — видно, развивается ли платформа и куда. -- **M0.5 Safety-политика автономии:** формализованные уровни L0-L3 + per-class правила (что орк может сам, что только через Славу). -- **M0.6 Контроль расходов на саморазвитие:** сам эпик не должен жечь бюджет бесконтрольно (связь M3). +- **G1** Safety-политика L0-L3 + per-class правила (что можно само, что только через Славу). Лейблы autoApprove/autoDeploy (ORCH-89) = уже зародыш. +- **G2** Бюджет на саморазвитие: лимит $/мес, чтобы контур не жёг бесконтрольно. +- **G3** Дашборд эволюции: метрики 5 доменов в динамике — видно, КУДА развивается платформа. +- **G4** Kill-switch петли: остановить самогенерацию задач одним флагом. --- -## 8. Связь с текущим Backlog (ничего не теряем) +## 10. 🌡️ Градусник автономности (сквозная метрика) -| Backlog-задача | Модуль | Действие | -|----------------|--------|----------| -| ORCH-8 петля самообучения | **M0** | ядро мета-контура | -| ORCH-83 наблюдаемость [ЭПИК] | **M1/M0** | фундамент мониторинга | -| ORCH-20 оценка задачи | M3 | M3.1/M3.3 | -| ORCH-23 бюджет breaker | M3 | M3.2 | -| ORCH-38 контроль токенов | M3 | M3.4/M3.8 | -| ORCH-19 дешёвый трек багов | M3 | M3.5 | -| ORCH-9 онбординг | M4 | M4.2 | -| ORCH-10 тиражирование | M4 | M4.3 | -| ORCH-12 тяжёлые расчёты | M2 | M2.4 | -| ORCH-13 мультипровайдер | M2/M3 | M2/роутер | -| ORCH-14 UX/UI | M2 | M2.3 | -| ORCH-15 Android | M2 | M2.1 | -| ORCH-18 интерактив-аналитик | M2 | M2.2 | -| ORCH-24 база знаний | M2 | M2.5 | -| ORCH-25 декомпозиция эпиков | M2/M0 | M2.6 | -| ORCH-27 coverage-гейт | M1 | надёжность | -| ORCH-28 человек-приёмка | M0 | safety | -| ORCH-94 флапп-статус | M1 | авто-ремедиация | - -**Вывод:** ~18 backlog-задач уже ложатся в 4 модуля. Эпик их не заменяет — **систематизирует и достраивает** до связного контура с управляющим мозгом (M0). +Объединяющая измеримая цель эпика. Каждый домен двигает её вверх: +- **% задач без ручного пинка** (сегодня было ~5 вмешательств: апрувы, домерж 063, sync 061). +- **Ручных вмешательств / неделю** (тренд вниз). +- **MTBF / MTTR** платформы (D1). +- **$/задача, токены/задача, время/задача** (D3). +- **Типов проектов/стеков поддержано** (D4). +- **Задач параллельно** (D5). +- **% уроков, ставших задачами** (двигатель). --- -## 9. Дорожная карта (предложение) +## 11. Связь с Backlog (ничего не теряем) -1. **Фаза 0 (фундамент):** ORCH-83 наблюдаемость (M1) + ORCH-8 журнал уроков (M0). Без данных нечем рулить. -2. **Фаза 1 (быстрые победы экономики):** M3.4 целевые файлы + M3.2 бюджет-breaker + M3.1 роутер. Дешёвый высокий impact. -3. **Фаза 2 (надёжность):** M1.3 транзиент-резилентность + M1.2 авто-ремедиация + M1.1 предиктив. -4. **Фаза 3 (мета-контур):** M0.2 ретроспективщик + M0.3 приоритизатор + M0.5 safety-политика → петля замыкается. -5. **Фаза 4 (масштаб/расширение):** M4.1 параллелизм + M4.2 онбординг + M2.* по спросу заказчиков. +| Backlog | Домен/вертикаль | +|---------|-----------------| +| ORCH-8 петля | 🧠 Двигатель (ядро) | +| ORCH-83 наблюдаемость | Фундамент F1 | +| ORCH-20/23/38/19 | 💰 D3 | +| ORCH-27/28 | ✅ D2 | +| ORCH-12/13/14/15/18/24/25 | 🚀 D4 | +| ORCH-9/10 | 📈 D5 | +| ORCH-94 флапп | 🛡️ D1.2 | +| ORCH-89 авто-лейблы | 🛑 G1 | + +~18 backlog-задач ложатся в структуру. Эпик их систематизирует и достраивает. --- -## 10. Открытые вопросы Славе (до декомпозиции) +## 12. Дорожная карта (предложение) -1. **Структура в Plane:** один мега-эпик ORCH-XX с 5 под-эпиками (M0-M4)? Или 5 отдельных эпиков? (Plane API v1 не умеет relations — иерархию ведём в доке + префиксах названий.) -2. **Safety-модель L0-L3:** согласен, что L3 (самомодификация агентов/ядра) — ВСЕГДА через твой апрув, без авто? Или где-то хочешь выше автономность? -3. **Приоритет модулей:** мой порядок Фаза0→экономика→надёжность→мета→масштаб. Согласен, или сначала масштаб (параллелизм)? -4. **Агент-ретроспективщик (M0.2):** заводить как агента в конвейере сразу, или сначала Стрим вручную ведёт журнал и предлагает? -5. **Бюджет на сам эпик:** лимит $/мес на саморазвитие, чтобы контур не жёг бесконтрольно? -6. **Первая задача:** с чего стартуем после апрува концепции — ORCH-83 (видимость) или быстрая победа M3.4 (целевые файлы, −стоимость сразу)? +1. **Фаза 0 (фундамент):** F1 наблюдаемость + F2 журнал. Без них рулить нечем. +2. **Фаза 1 (две руки параллельно):** + - крепнем: D3.4 целевые файлы + D3.2 бюджет-breaker (дешёвый impact) + - растём: D4.1 стеки-плагины ИЛИ D4.4 интерактив-аналитик (по спросу) +3. **Фаза 2:** D1 надёжность (транзиент-резилентность, авто-ремедиация) + D2 качество + D5.1 параллелизм. +4. **Фаза 3 (мозг):** E2 ретроспективщик + E3 приоритизатор + G1 safety-политика → петля замыкается, дальше платформа предлагает сама. + +--- + +## 13. Открытые вопросы Славе + +1. **Структура Plane:** мега-эпик с фундаментом+5 доменами+2 вертикалями? Или эпик на каждый домен? +2. **D4 (возможности):** какой стек/фича приоритетны для тебя/заказчиков — Android, UX/UI, тяжёлые расчёты, интерактив-аналитик? С чего рост начинать? +3. **Баланс «крепнем vs растём»:** идти строго параллельно обеими руками, или в каждой фазе перевес в одну сторону? +4. **Safety L3:** подтверждаешь — самомодификация ядра/агентов всегда через твой апрув? +5. **Ретроспективщик (E2):** агент сразу, или сначала Стрим вручную ведёт журнал? +6. **Бюджет на эпик (G2):** лимит $/мес? +7. **Первая задача** после апрува: F1 наблюдаемость, быстрая победа D3.4, или сразу рост D4.*?