auto-sync: 2026-06-04 02:50:01

This commit is contained in:
Stream
2026-06-04 02:50:01 +03:00
parent 7bbd6809e3
commit 77c38ed8dd

View File

@@ -0,0 +1,135 @@
# Dev Report: БАГ 8 — deploy verdict gate
Дата: 2026-06-03
Статус: DONE
## Задача
Завести QG `check_deploy_status` по образцу `check_reviewer_verdict`, гейтить deploy→done
на машинном вердикте deployer'а (`deploy_status:` из `14-deploy-log.md`), а не на exit_code
LLM-процесса (всегда 0). PR в main, НЕ мержить/деплоить.
## Сделано
- [x] Ветка `fix/deploy-verdict-gate` из свежего main (a0621b9, PR#18)
- [x] Правка 1: `check_deploy_status` + регистрация в QG_CHECKS
- [x] Правка 2: `stages.py` deploy qg None → check_deploy_status
- [x] Правка 3: вердикт-проверка в advance deploy→done
- [x] Тесты: +7 (test_qg) +3 (test_stage_engine), все зелёные
- [x] Commit + push, remote проверен (ORCH-7), PR #19
- [x] Правка 4: НЕ трогал (enduro-trails) — см. ниже
## Изменённые файлы
- `src/qg/checks.py` — новая функция `check_deploy_status` + запись в QG_CHECKS
- `src/stages.py` — deploy `"qg": None``"qg": "check_deploy_status"`
- `src/stage_engine.py` — новая deployer-ветка в `_handle_qg_failure_rollbacks`
- `tests/test_qg.py` — class TestCheckDeployStatus (7 тестов)
- `tests/test_stage_engine.py` — class TestDeployVerdict (3 теста)
## Правка 1 — точный код check_deploy_status (src/qg/checks.py)
```python
def check_deploy_status(repo: str, work_item_id: str, branch: str | None = None) -> tuple[bool, str]:
"""
БАГ 8 fix: gate the deploy -> done transition on the deployer's machine-readable
verdict in 14-deploy-log.md frontmatter, NOT on the LLM process exit code
(which is always 0 on a successful agent session even when the deploy failed).
Mirrors check_reviewer_verdict (S-5): reads ONLY `deploy_status:` from YAML
frontmatter. Returns:
(True, ...) -> deploy_status: SUCCESS
(False, ...) -> deploy_status: FAILED, missing field, or no frontmatter
"""
import yaml
repo_path = _repo_path(repo, branch)
log_path = os.path.join(repo_path, f"docs/work-items/{work_item_id}/14-deploy-log.md")
if not os.path.isfile(log_path):
return False, "Deploy log not found (14-deploy-log.md)"
try:
with open(log_path, "r") as f:
content = f.read()
status = None
if content.startswith("---"):
parts = content.split("---", 2)
if len(parts) >= 3:
try:
fm = yaml.safe_load(parts[1]) or {}
except yaml.YAMLError as e:
return False, f"Invalid YAML frontmatter in deploy log: {e}"
status = str(fm.get("deploy_status", "")).upper().strip()
if status == "SUCCESS":
return True, "Deploy status: SUCCESS"
if status == "FAILED":
return False, "Deploy status: FAILED"
return False, f"No machine-readable deploy_status in frontmatter (got: {status!r})"
except OSError as e:
return False, f"Error reading deploy log: {e}"
```
Регистрация в QG_CHECKS: `"check_deploy_status": check_deploy_status,` (после check_tests_local).
## Правка 2 — stages.py
`"deploy": {"next": "done", "agent": None, "qg": None}`
`"deploy": {"next": "done", "agent": None, "qg": "check_deploy_status"}`
## Правка 3 — ГДЕ нашёл advance deploy→done и как вписал вердикт
Auto-advance унифицирован в `src/stage_engine.py::advance_stage` (ORCH-4/M-3 merge).
launcher.py:_try_advance_stage (стр.648) — тонкий wrapper, который грузит task по (repo,branch)
и вызывает `advance_stage(current_stage=<db stage>, finished_agent=agent)`. Когда deployer
завершается, current_stage="deploy", finished_agent="deployer".
В `advance_stage` QG уже выполняется ГЕНЕРИЧЕСКИ:
- `qg_name = get_qg_for_stage("deploy")` теперь = "check_deploy_status";
- `_run_qg` → ветка «everything else» → `check_deploy_status(repo, work_item_id, branch)` (сигнатура совпала);
- SUCCESS (True) → блок Advance: update_task_stage(done)+notify (агент не запускается, agent=None);
- FAILED (False) → вызывается `_handle_qg_failure_rollbacks(...)`.
В `_handle_qg_failure_rollbacks` НЕ было ветки для deployer → ничего не происходило. Добавил
новую ветку (после architect-ветки, в конце функции), триггер по ВЕРДИКТУ не exit_code:
```python
if agent == "deployer" and qg_name == "check_deploy_status":
update_task_stage(task_id, "development")
notify_stage_change(task_id, current_stage, "development")
plane_notify_stage(work_item_id, current_stage, "development")
result.rolled_back_to = "development"
set_issue_blocked(work_item_id)
notify_qg_failure(task_id, "deploy", "check_deploy_status", reason)
plane_add_comment(work_item_id, "❌ Deploy FAILED (...). Rolled back ...", author="deployer")
send_telegram("🚨 {wid}: Deploy FAILED (...). Rolled back to development. Needs fix.")
result.alerted = True
logger.error(...)
```
launcher.py:475 блок (exit_code-based deployer-failure) НЕ удалён — оставлен как был; он просто
не срабатывает (exit_code=0), а реальный гейт теперь по вердикту. Advance других стадий не тронут.
## Новые тесты
test_qg.py / TestCheckDeployStatus (через tmp 14-deploy-log.md + fixture с monkeypatch repos_dir):
- SUCCESS frontmatter → True; FAILED → False; нет файла → False; нет поля → False;
prose-only без frontmatter → False; get_qg_for_stage("deploy")=="check_deploy_status";
зарегистрирована в QG_CHECKS.
test_stage_engine.py / TestDeployVerdict (pure-logic, БЕЗ TestClient POST):
- FAILED вердикт → НЕ done, откат в development, alerted, set_issue_blocked, send_telegram;
- нет лога → откат в development; SUCCESS → done, агент не запущен, jobs пусто.
## Результат — полный вывод pytest (контейнер)
`docker run --rm -v ... --entrypoint python3 orchestrator-orchestrator -m pytest tests/ -q`
**10 failed, 227 passed**
- passed: 217 (baseline PR#18) + 10 новых = 227 ✓ (не уронил)
- 10 failed — ровно baseline off-limits (9 HMAC/401 в test_webhooks + 1 webhook-POST
test_plane_webhook_event_logged). Их не трогал.
Целевой прогон новых: `pytest TestCheckDeployStatus TestDeployVerdict -v` → 10 passed.
## Статус правки 4 (deployer-промпт enduro-trails)
НЕ трогал (по умолчанию — только orchestrator). **Требует отдельной правки в репо
admin/enduro-trails**: `.openclaw/agents/deployer.md` обязать deployer'а писать YAML-frontmatter
в начало `14-deploy-log.md`:
```
---
deploy_status: SUCCESS # или FAILED
version: vX.Y.Z
---
```
Без этого frontmatter check_deploy_status вернёт False (нет поля) → задача откатится в
development. То есть гейт fail-safe, но для прохождения SUCCESS промпт enduro-trails надо обновить.
## Push / PR (ORCH-7 проверен)
- Коммит: `e4a9c48 fix(deploy): gate deploy->done on deployer verdict, not LLM exit code`
- `git log origin/main..origin/fix/deploy-verdict-gate` → e4a9c48 (remote содержит коммит ✓)
- PR #19: https://git.mva154.duckdns.org/admin/orchestrator/pulls/19 (fix/deploy-verdict-gate → main)
- НЕ мержил, НЕ деплоил — мерж + боевой прогон делает ассистент.