diff --git a/memory/2026-06-09.md b/memory/2026-06-09.md index 2887c7c..1abc8d1 100644 --- a/memory/2026-06-09.md +++ b/memory/2026-06-09.md @@ -211,3 +211,18 @@ - Закрыла brd-clock → PATCH In Review→Approved (200) → architect job 1183 running, stage=architecture. - Очередь движется: 090(arch running)→091→093 (062 ушла вперёд, в очереди её нет). - Скоуп STOP: G1 остановка (SIGTERM+отмена job+исчерпание ретраев+снятие таймеров) / G2 полный сброс (ветка+worktree+durable cancelled, docs сохранить) / G3 единственный вход To Analyse / G4 закрыть дыру релонча / G5 идемпотентность+fail-safe merge/deploy. never-raise/kill-switch/restart-safe. 14 TC, 10 AC. + +## 🧬 КОНЦЕПЦИЯ ЭПИКА «Автономное саморазвитие платформы» (Слава, 09.06 ~17:48 MSK) +- **Задача Славы:** проанализировать уроки орка (память+репо) + ORCH-8, инвентаризировать ВСЕ задачи Plane (все статусы), погуглить мировые практики → концепция автономного саморазвития по 4 блокам + управление. +- **Документ:** `tasks/orchestrator/EPIC_AUTONOMOUS_SELF_EVOLUTION.md` (14КБ). +- **Инвентаризация Plane: 94 задачи** (63 Done, 21 Backlog, 4 Cancelled, остальные в работе). Backlog уже содержит ~18 зародышей всех 4 блоков. +- **ORCH-8** = ядро петли самообучения (детекция→журнал→анализ→предложение→конвейер ORCH-7→проверка). Safety-принцип ORCH-8: самомодификация агентов/ядра ТОЛЬКО через PR+апрув Славы, никогда не авто в рантайме. +- **Структура концепции:** 4 модуля Славы + мета-контур M0: + - M1 Self-Repairing (надёжность): ORCH-83 фундамент, предиктив, авто-ремедиация, транзиент-резилентность, zero-downtime, chaos-staging, agent-liveness, backup. + - M2 Расширение: стеки-плагины, интерактив-аналитик (ORCH-18), UX/UI (ORCH-14), Android (ORCH-15), тяжёлые расчёты (ORCH-12), база знаний (ORCH-24), декомпозиция эпиков (ORCH-25). + - M3 Экономика: model-routing cascade (−87% мир), бюджет-breaker (ORCH-23), оценка задачи (ORCH-20), целевые файлы (ORCH-38, дешёвый высокий impact — developer жёг $13.68 на мелочь), fast-track багов (ORCH-19), semantic caching. + - M4 Масштаб: параллелизм (снять max_concurrency=1), онбординг (ORCH-9), тиражирование на хост (ORCH-10), воркер-пул, мультитенант. + - **M0 Управление:** петля ORCH-8 + safety-модель L0-L3 (L3 самомодификация=всегда апрув Славы) + журнал уроков + агент-ретроспективщик + приоритизатор RICE + дашборд эволюции. Лейблы autoApprove/autoDeploy (ORCH-89) = уже механизм управления автономией. +- **Мир-практики:** STRATUS NeurIPS'25 (мультиагент SRE), ChaosEater ASE'25, self-healing LLM-agents arXiv'26, causal AIOps Stanford, model-routing −87%/semantic-caching −31%, FinOps guardrails. +- **6 открытых вопросов Славе** в доке (структура Plane, safety L3, приоритет фаз, ретроспективщик сразу/потом, бюджет на эпик, первая задача). +- ⏳ Ждёт апрува концепции → потом декомпозиция в задачи Plane. НЕ заводила задачи (концепция первая). diff --git a/tasks/orchestrator/EPIC_AUTONOMOUS_SELF_EVOLUTION.md b/tasks/orchestrator/EPIC_AUTONOMOUS_SELF_EVOLUTION.md new file mode 100644 index 0000000..cda82da --- /dev/null +++ b/tasks/orchestrator/EPIC_AUTONOMOUS_SELF_EVOLUTION.md @@ -0,0 +1,206 @@ +# 🧬 ЭПИК: Автономное саморазвитие платформы оркестратора + +> **Статус:** концепция (для апрува Славы → декомпозиция в задачи) +> **Автор:** Стрим · **Дата:** 2026-06-09 · **Заказчик:** Слава +> **Связанные:** ORCH-8 (петля самообучения), ORCH-83 (наблюдаемость), ORCH-54 (автономное внедрение, done) +> **Источники:** память орка (инциденты 06–09.06), инвентаризация 94 задач Plane, мировые практики (STRATUS NeurIPS'25, ChaosEater ASE'25, self-healing LLM-agents arXiv'26, agentic AIOps, FinOps token-economics). + +--- + +## 0. Зачем это (vision) + +Оркестратор уже **автономно внедряет** (ORCH-54 достигнут: задача проходит analysis→prod без человека). Но автономность исполнения ≠ автономное **развитие**. Сегодня платформу развивает связка Слава+Стрим вручную: ловим инциденты → формулируем уроки → заводим задачи → апрувим. + +**Цель эпика:** превратить это в управляемый самоподдерживающийся контур, где платформа сама: +- замечает свои слабые места (надёжность, стоимость, узкие места), +- предлагает улучшения как готовые задачи, +- проводит их через собственный конвейер (ORCH-7 self-hosting), +- **под контролем человека на ключевых развилках** (safety > автономность). + +Эпик делится на **4 модуля развития** + **1 управляющий контур** (мета-слой, который рулит первыми четырьмя). + +--- + +## 1. Принцип деления (по Славе) + +| # | Модуль | Суть | Метрика успеха | +|---|--------|------|----------------| +| **M1** | 🛡️ **Self-Repairing** (надёжность) | Стабильность, отказоустойчивость, производительность БЕЗ потери функциональности | MTBF↑, MTTR↓, % автономных задач без ручного пинка↑ | +| **M2** | 🚀 **Расширение функционала** | Новые возможности для заказчиков: стеки, фичи, удобства | число поддержанных типов проектов/стеков↑ | +| **M3** | 💰 **Экономика** | Оптимизация $/токенов/времени/ресурсов на задачу + контроль расходов | $/задача↓, токены/задача↓, время/задача↓ при том же качестве | +| **M4** | 📈 **Масштабируемость** | Параллелизм, онбординг проектов, перенос на новую инфру | задач параллельно↑, время онбординга проекта↓ | +| **M0** | 🧭 **Управление саморазвитием** | Мета-контур: петля обучения, приоритизация, safety-гейты, дашборд эволюции | покрытие уроков→задачами↑, 0 неконтролируемых самоизменений | + +--- + +## 2. Мировые практики (что берём) + +- **STRATUS (NeurIPS'25)** — мультиагентная автономная reliability-инженерия облака: агенты-расследователи + remediation с гарантиями безопасности. → паттерн для M1 (агент-SRE). +- **ChaosEater (ASE'25)** — автоматизация chaos-engineering через LLM. → M1: периодически инъецировать сбои в staging, проверять самовосстановление. +- **Self-Healing LLM-agents (arXiv 2026)** — мониторинг ВНУТРЕННЕГО reasoning агента + внешних результатов исполнения. → M0/M1: liveness не только по pid, но по «думает ли осмысленно». +- **Agentic AIOps (LogicMonitor/Deimos 2025-26)** — зрелость: reactive→assistive→autonomous; «humans still press enter» на критичном. → M0 safety-модель. +- **Causal AIOps (Stanford NeurIPS'25)** — предсказание сбоев плато на ~90% без причинно-следственного вывода. → M1 предиктивный мониторинг = causal, не только корреляция. +- **Model routing cascades (−87% стоимости)** + **semantic caching (−31%)** + **prompt compression (LLMLingua)** + **runtime token governance** (TechTarget'26). → прямо в M3. +- **FinOps guardrails** (Flexera/Amnic 2026): автономные cost-гардрейлы, бюджет-aware решения, аномалии расходов. → M3 + M0. + +--- + +## 3. МОДУЛЬ M1 — 🛡️ Self-Repairing (надёжность) + +**Что уже есть (фундамент):** reconciler (ORCH-53), post-deploy monitor+rollback (ORCH-21), merge-verify (ORCH-71/73), job-reaper+stale-lease (ORCH-65), security-гейт (ORCH-22), disk-watchdog (ORCH-63), build-cache-prune (ORCH-62). + +**Уроки из истории, которые M1 закрывает системно:** +- Фантом-merge (08.06): прод расходился с main, 4 PR не слиты → накопительная потеря кода. +- Deploy-петля (06–07.06): bootstrap-парадокс, ложный staging FAIL. +- Транзиенты (09.06): Anthropic Overloaded (отретраился) + Gitea 405 (не отретраился → ложный HOLD). +- Флаппинг статусов (09.06, ORCH-94): done-задача дёргает deploy-статусы вечно. +- Зомби-jobs/merge-lease залип (06.06). + +**Кандидаты-задачи M1:** +- **M1.1 Предиктивный мониторинг** (на базе ORCH-83): time-series по диску/памяти/очереди → алерт ДО исчерпания (causal, не только порог). Прогноз «диск заполнится через N часов». +- **M1.2 Авто-ремедиация рантайма** (расширение reconciler): типовые сбои чинятся сами по runbook (зомби-job→requeue, stale-lease→reclaim, флапп-статус→форс-терминал). Каталог авто-фиксов. +- **M1.3 Транзиент-резилентность everywhere** (обобщение ORCH-93): единый retry-with-backoff слой для ВСЕХ внешних вызовов (Gitea/Plane/Anthropic) — breaker-паттерн как у агентов. +- **M1.4 Zero-downtime деплой** платформы: blue-green/canary для self-hosting (сейчас рестарт = окно недоступности). Резервное плечо. +- **M1.5 Авто-rollback по SLO** (расширение ORCH-21): не только health-check, но деградация метрик (latency/error-rate) → откат. +- **M1.6 Chaos-в-staging** (ChaosEater-паттерн): периодически ломать staging, проверять что monitor+rollback ловят. +- **M1.7 Agent-liveness deep** (self-healing LLM): детект «агент думает vs завис vs зациклился» по reasoning+CPU+прогрессу (урок: analyst завис 22 мин, лезли в /proc). +- **M1.8 Backup/restore** БД орка + worktree-state (durable recovery после краша хоста). + +--- + +## 4. МОДУЛЬ M2 — 🚀 Расширение функционала + +**Backlog уже содержит зародыши:** +- **ORCH-12** тяжёлые миграции/расчёты (опциональная стадия). +- **ORCH-14/18** UX/UI дизайнер + интерактивный аналитик (живой диалог, макеты). +- **ORCH-15** Android-приложения (мобильный стек). +- **ORCH-13** мультипровайдерность LLM (Claude+OpenRouter+др). +- **ORCH-24** персистентная база знаний проекта. +- **ORCH-25** декомпозиция эпиков (фича→подзадачи→сборка). +- **ORCH-27** code-coverage гейт. +- **ORCH-28** опциональная человеческая приёмка. + +**Кандидаты-задачи M2:** +- **M2.1 Стеки-плагины:** формализовать «профиль стека» (web/mobile/data/ML) → агенты адаптируют процесс под стек. Расширяемо без правки ядра. +- **M2.2 Интерактивный аналитик** (ORCH-18): диалог Слава↔analyst для уточнения BRD + согласования макетов до старта. +- **M2.3 UX/UI слой** (ORCH-14): дизайнер-агент генерит макеты на аналитике. +- **M2.4 Тяжёлые вычисления** (ORCH-12): стадия/воркер для долгих расчётов вне основного цикла. +- **M2.5 База знаний проекта** (ORCH-24): RAG-контекст решений/архитектуры для агентов (меньше «слепого сканирования» = ещё и экономия). +- **M2.6 Декомпозиция эпиков** (ORCH-25): автоматический разбор эпика на задачи (этот документ — кандидат №1 на проверку). + +--- + +## 5. МОДУЛЬ M3 — 💰 Экономика + +**Backlog-фундамент:** ORCH-20 (оценка), ORCH-23 (бюджет circuit-breaker), ORCH-38 (контроль токенов), ORCH-19 (дешёвый трек багфикса), ORCH-92 (промпт-аудит, done — частично эффорт). + +**Боль (факт из ORCH-38):** developer сжёг **$13.68 на мелкую задачу** (cache_read 18.98M — слепое сканирование src/). Стоимость линейно зависит от перечитывания контекста. + +**Кандидаты-задачи M3:** +- **M3.1 Model routing cascade** (мир: −87%): классификатор сложности (trivial/small/medium/complex) → дешёвая модель на простое, opus только на сложное (ORCH-20 шаг 2 + ORCH-13). Роутер-модель дешёвая. +- **M3.2 Бюджет circuit-breaker** (ORCH-23): хард-лимит $/токенов/времени на задачу/стадию → пауза+алерт при превышении. Защита по факту. +- **M3.3 Оценка задачи ДО старта** (ORCH-20 шаг 1): прогноз $/время по истории похожих → Слава видит до запуска. +- **M3.4 Целевые файлы в задании** (ORCH-38): analyst кладёт точный список файлов из TRZ → агент не сканирует вслепую (главный пожиратель cache_read). **Самый дешёвый высокоэффективный фикс.** +- **M3.5 Fast-track для простых задач** (ORCH-19): багфикс/тривиал → урезанный цикл (без architect, дешёвая модель) вместо полного 6-стадийного. +- **M3.6 Эффорт-дисциплина** (на базе ORCH-92): per-stage effort, дешёвые модели на механику. +- **M3.7 Semantic caching / prompt compression** (мир: −31%): кэш повторяющихся контекстов, сжатие промптов. +- **M3.8 Cost-дашборд + аномалии** (связь M0): $/repo×agent, детект выбросов (как ORCH-16 поймали). + +--- + +## 6. МОДУЛЬ M4 — 📈 Масштабируемость + +**Backlog-фундамент:** ORCH-9 (онбординг проектов turnkey), ORCH-10 (тиражирование на др. хост), ORCH-88 (пакетный режим, done — serial), ORCH-6 (multi-repo, done). + +**Текущее ограничение:** `max_concurrency=1` (serial-gate ORCH-88) — задачи идут по одной. Это сознательно для надёжности на этапе становления, но потолок масштаба. + +**Кандидаты-задачи M4:** +- **M4.1 Параллельная разработка** (снять max_concurrency=1): безопасный N>1 (изоляция worktree уже есть ORCH-2; нужен merge-orchestration FIFO, защита от гонок main). Много фич параллельно. +- **M4.2 Turnkey онбординг проекта** (ORCH-9): один скрипт/команда → Plane-проект + Gitea-репо + агенты + инфра. Минута вместо часов. +- **M4.3 Тиражирование на новый хост** (ORCH-10): перенос всей платформы на инфру нового заказчика (IaC/compose-bundle). +- **M4.4 Per-repo масштаб ресурсов:** разные лимиты concurrency/бюджета на проект. +- **M4.5 Горизонтальный воркер-пул:** очередь jobs уже есть (ORCH-1) → несколько воркеров/хостов тянут одну очередь. +- **M4.6 Мультитенантность:** изоляция заказчиков (БД/секреты/доступы) для SaaS-сценария. + +--- + +## 7. МОДУЛЬ M0 — 🧭 Управление саморазвитием (мета-контур) + +> Это «мозг» эпика. Без него M1-M4 — просто список задач. M0 = ПЕТЛЯ, которая их генерит, приоритизирует и контролирует. Ядро = **ORCH-8**. + +### 7.1 Петля самообучения (ORCH-8) +``` +ДЕТЕКЦИЯ отклонения → ЖУРНАЛ урока (машинный) → АНАЛИЗ/паттерны → ПРЕДЛОЖЕНИЕ задачи → [SAFETY-ГЕЙТ] → конвейер (ORCH-7) → проверка эффекта → обновление журнала +``` +- **Детекция:** провал гейта, **ручное вмешательство человека (самый ценный сигнал — каждый ручной пинок = дыра автономности)**, ретраи/откаты/таймауты, ложные срабатывания, «деплой OK, прод сломан». +- **Журнал:** структурированный (тип, контекст задача/стадия/агент, корень, предложение, статус) — НЕ свободный текст. Формализовать то, что сейчас в memory/. +- **Анализ:** гибрид (склонение Стрим) — машина копит и предлагает черновик → Стрим фильтрует/оформляет → Слава апрувит. + +### 7.2 Safety-модель (КЛЮЧЕВОЕ — «контроль и управление») +**Принцип (ORCH-8, незыблемо):** самомодификация платформы (промпты/скиллы/конфиги агентов/ядро) — **ТОЛЬКО через PR + ревью + апрув Славы**. Никаких авто-правок в рантайме без человека в петле. Оркестратор ПРЕДЛАГАЕТ, ПРИМЕНЯЕТ через свой же конвейер с гейтами. + +**Уровни автономии (по зрелости, agentic AIOps):** +| Уровень | Что можно авто | Гейт | +|---------|----------------|------| +| L0 reactive | только алерт | человек делает всё | +| L1 assistive | предложить задачу+ТЗ (autoApprove/autoDeploy лейблы уже есть!) | человек апрувит запуск | +| L2 autonomous-bounded | сам гонит безопасные классы (бэкенд-фиксы) до прода | safety-гейты (CI/staging/regression) держат | +| L3 self-modifying | менять агентов/ядро | **всегда** PR+апрув Славы, никогда не авто | + +→ Текущие лейблы `autoApprove`/`autoDeploy` (ORCH-89) = уже механизм управления автономией per-task. M0 их обобщает в политику. + +### 7.3 Управление и видимость +- **M0.1 Журнал уроков** (ORCH-8 шаг 1): машинная таблица отклонений + связь с задачами. +- **M0.2 Агент-ретроспективщик:** после задачи/по расписанию анализирует уроки → черновик предложения. +- **M0.3 Приоритизатор:** ранжирует кандидатов M1-M4 по impact/cost/risk (RICE-подобно). Что брать первым. +- **M0.4 Дашборд эволюции** (расширение ORCH-83): метрики 4 модулей в динамике — видно, развивается ли платформа и куда. +- **M0.5 Safety-политика автономии:** формализованные уровни L0-L3 + per-class правила (что орк может сам, что только через Славу). +- **M0.6 Контроль расходов на саморазвитие:** сам эпик не должен жечь бюджет бесконтрольно (связь M3). + +--- + +## 8. Связь с текущим Backlog (ничего не теряем) + +| Backlog-задача | Модуль | Действие | +|----------------|--------|----------| +| ORCH-8 петля самообучения | **M0** | ядро мета-контура | +| ORCH-83 наблюдаемость [ЭПИК] | **M1/M0** | фундамент мониторинга | +| ORCH-20 оценка задачи | M3 | M3.1/M3.3 | +| ORCH-23 бюджет breaker | M3 | M3.2 | +| ORCH-38 контроль токенов | M3 | M3.4/M3.8 | +| ORCH-19 дешёвый трек багов | M3 | M3.5 | +| ORCH-9 онбординг | M4 | M4.2 | +| ORCH-10 тиражирование | M4 | M4.3 | +| ORCH-12 тяжёлые расчёты | M2 | M2.4 | +| ORCH-13 мультипровайдер | M2/M3 | M2/роутер | +| ORCH-14 UX/UI | M2 | M2.3 | +| ORCH-15 Android | M2 | M2.1 | +| ORCH-18 интерактив-аналитик | M2 | M2.2 | +| ORCH-24 база знаний | M2 | M2.5 | +| ORCH-25 декомпозиция эпиков | M2/M0 | M2.6 | +| ORCH-27 coverage-гейт | M1 | надёжность | +| ORCH-28 человек-приёмка | M0 | safety | +| ORCH-94 флапп-статус | M1 | авто-ремедиация | + +**Вывод:** ~18 backlog-задач уже ложатся в 4 модуля. Эпик их не заменяет — **систематизирует и достраивает** до связного контура с управляющим мозгом (M0). + +--- + +## 9. Дорожная карта (предложение) + +1. **Фаза 0 (фундамент):** ORCH-83 наблюдаемость (M1) + ORCH-8 журнал уроков (M0). Без данных нечем рулить. +2. **Фаза 1 (быстрые победы экономики):** M3.4 целевые файлы + M3.2 бюджет-breaker + M3.1 роутер. Дешёвый высокий impact. +3. **Фаза 2 (надёжность):** M1.3 транзиент-резилентность + M1.2 авто-ремедиация + M1.1 предиктив. +4. **Фаза 3 (мета-контур):** M0.2 ретроспективщик + M0.3 приоритизатор + M0.5 safety-политика → петля замыкается. +5. **Фаза 4 (масштаб/расширение):** M4.1 параллелизм + M4.2 онбординг + M2.* по спросу заказчиков. + +--- + +## 10. Открытые вопросы Славе (до декомпозиции) + +1. **Структура в Plane:** один мега-эпик ORCH-XX с 5 под-эпиками (M0-M4)? Или 5 отдельных эпиков? (Plane API v1 не умеет relations — иерархию ведём в доке + префиксах названий.) +2. **Safety-модель L0-L3:** согласен, что L3 (самомодификация агентов/ядра) — ВСЕГДА через твой апрув, без авто? Или где-то хочешь выше автономность? +3. **Приоритет модулей:** мой порядок Фаза0→экономика→надёжность→мета→масштаб. Согласен, или сначала масштаб (параллелизм)? +4. **Агент-ретроспективщик (M0.2):** заводить как агента в конвейере сразу, или сначала Стрим вручную ведёт журнал и предлагает? +5. **Бюджет на сам эпик:** лимит $/мес на саморазвитие, чтобы контур не жёг бесконтрольно? +6. **Первая задача:** с чего стартуем после апрува концепции — ORCH-83 (видимость) или быстрая победа M3.4 (целевые файлы, −стоимость сразу)?