diff --git a/memory/2026-06-08.md b/memory/2026-06-08.md index 0e3ecd8..e681fa5 100644 --- a/memory/2026-06-08.md +++ b/memory/2026-06-08.md @@ -400,5 +400,16 @@ - **ФИКС:** ОБНОВИТЬ CLI до ≥v2.1.154 (`claude update` / пересборка образа), сохранив OAuth-креды. → заведена **ORCH-85 [URGENT] seq=85** id=b77d210e-e405-4dd9-9dc2-304d8a59c5dc. - **Две задачи заведены (Слава, Backlog):** ORCH-84 seq=84 (id=1b1854d4-...) удалить неиспользуемый cli-proxy (LOW); ORCH-85 seq=85 обновить CLI (URGENT). - ⚠️ ПОКА CLI не обновлён — НЕ применять `--effort` (все агенты падают). ORCH-81 висит именно из-за этого. Решение по разблокировке (откат effort vs срочное обновление CLI) — за Славой. + +## ✅ CLI ОБНОВЛЁН 2.1.142→2.1.168 — ЭФФОРТ ОЖИЛ (08.06 ~21:25 UTC) — Слава: «только обновить CLI сейчас» +- **Схема обновления (запомнить):** CLI = npm-пакет `@anthropic-ai/claude-code` глобально на ХОСТЕ (`/usr/lib/node_modules/...`, npm prefix /usr, root-owned). В контейнер маунтится read-only как `/opt/claude-code`. node v22, npm 10.9. +- **Шаги:** (1) бэкап `/home/slin/cli-backup-20260609-002048` (package.json 2.1.142 + credentials); (2) `echo PASS | sudo -S npm install -g @anthropic-ai/claude-code@latest` → 2.1.168; (3) **npm пересоздал каталог с НОВЫМ inode** → контейнерный bind-mount указывал на старый → `claude.exe No such file` в контейнере; (4) **`docker restart orchestrator`** перемонтировал → починилось. +- ✅ **КРИТ-ТЕСТ пройден:** `--effort high` и `--effort xhigh` на opus-4-8 теперь дают нормальный JSON (rc=0, len~1450). OAuth (sub max) жив. Орк после рестарта здоров (queue_worker/reconciler/reaper started). +- ⚠️ **МОЙ БАГ при requeue ORCH-81 (урок TZ):** выставила `available_at` через `time.strftime` в КОНТЕЙНЕРНОМ TZ (MSK), а `claim_next_job` сравнивает с `datetime('now')` = **UTC** → available_at оказался в будущем на 3ч → job не клеймился. Фикс: `available_at=NULL`. **ПРАВИЛО: времена в jobs.available_at писать В UTC (datetime('now')/utcnow), НЕ в локальном TZ.** +- ✅ ORCH-81 разблокирована: analyst run_id=407 pid=241 запущен НА CLI 2.1.168 (первый запуск после фикса). Если CLI был корнем — отработает нормально (не зависнет). ORCH-85 можно закрывать (сделано вручную). + +## 📝 ORCH-86 заведена — reconciler шлёт шум «ET-002 done разблокирована» в Telegram (08.06 ~21:24 UTC, Слава: «приходит периодически, заводи исправление») +- **Продолжение ORCH-068** (тот livelock-фикс done, но НЕ закрыл этот путь). seq=86 id=d8133fbe-d16f-4787-85a4-3cabec4338c2, Backlog, MEDIUM. +- **Корень (код-аудит):** `_note_unblock` (reconciler.py ~444) шлёт В Telegram. Dedup-guard ORCH-068 ключуется по state_uuid и работает только если state_uuid≠None. НО путь стр.228 (advance_if_gate_passed→_note_unblock) передаёт ТОЛЬКО 2 аргумента без state_uuid → dedup пропускается → шлёт каждый раз. + терминал-скип этот путь не ловит (advance_if_gate_passed считает ET-002 done «продвинувшейся»). Триггерится особенно при СТАРТЕ reconciler (после рестарта). G1 root-cause / G2 терминал-скип на этот путь / G3 state_uuid во все вызовы. - **ИРОНИЯ:** фикс ORCH-52h заставил эффорт РЕАЛЬНО применяться (per-role floor) → и тем СЛОМАЛ ЗАПУСК ВСЕХ 6 агентов (до этого эффорт был пустой → флаг не передавался → работало). 074 прошла быстро ИМЕННО потому что эффорт тогда ещё не применялся! - **ГОРИТ: СЕЙЧАС ЛЮБОЙ агент орка упадёт** (эффорт применяется ко всем). Варианты фикса: (a) обновить/починить claude-cli-proxy чтоб пробрасывал effort; (b) временно ОТКЛЮЧИТЬ --effort (вернуть пустые env или откат ORCH-52h) пока proxy не чинится; (c) разобраться с proxy. **Ждёт решения Славы (прод-конфиг).**