6.2 KiB
result, work_item, stage, author_agent, status, created_at, model_used, type, work_item_id
| result | work_item | stage | author_agent | status | created_at | model_used | type | work_item_id |
|---|---|---|---|---|---|---|---|---|
| PASS | ORCH-077 | testing | tester | pass | 2026-06-09 | claude-opus-4-8 | test-report | ORCH-077 |
Test Report — ORCH-077 — ORCH-52d: канон Anthropic для 6 системных промптов + эмиссия схемы 52c
Окружение
- Python: 3.12.13
- pytest: 8.3.3
- Дата: 2026-06-09
- Worktree:
/repos/_wt/orchestrator/feature_ORCH-077-orch-52d-6-anthropic - Ветка:
feature/ORCH-077-orch-52d-6-anthropic - Review-вердикт (предусловие):
12-review.md→ APPROVED (0× P0/P1) ✅
Smoke API (read-only, прод 8500)
| Endpoint | Результат |
|---|---|
GET /health |
{"status":"ok","service":"orchestrator"} → OK |
GET /status |
200, активные задачи отдаются (ORCH-077 в testing, ET-013 в development) → OK |
GET /queue |
200, counts queued:0 running:1 done:945, breaker closed, preflight_ok → OK |
Прод-контейнер не трогался (никаких рестартов/деструктива — только чтение).
Результаты (покрытие ТЗ — 04-test-plan.yaml)
| TC ID | Описание | Тест/метод | Результат |
|---|---|---|---|
| TC-01 | 5 XML-секций (<context>/<task>/<deliverables>/<constraints>/<output_format>) во всех 6 промптах (AC-1) |
test_five_xml_sections_present ×6 |
PASS |
| TC-02 | Все 6 имён полей схемы 52c в теле каждого промпта (AC-2) | test_six_schema_field_names_present ×6 |
PASS |
| TC-03 | Корректные роле-специфичные author_agent==роль и stage (AC-2) |
test_schema_pins_role_specific_author_and_stage ×6 |
PASS |
| TC-04 | Ссылка на docs/_templates/ + эталон ORCH-073/ORCH-088 (AC-3) |
test_references_templates_and_a_reference_work_item ×6 |
PASS |
| TC-05 | Анти-регресс machine-verdict ключей (verdict:/result:/staging_status:/deploy_status:, регистр сохранён) (AC-4) |
test_machine_verdict_keys_preserved_exact_case |
PASS |
| TC-06 | Анти-регресс deployer self-hosting (canonical docker exec orchestrator-staging, pr_already_merged, «не рестартить 8500», ORCH-061 INFRA-WAIVED) (AC-4) |
test_deployer_self_hosting_anti_regress |
PASS |
| TC-07 | Анти-регресс ключевых маркеров ролей (analyst 4 deliverable+Write; architect ADR+эскалация; developer TDD+«не мержить свой PR»; reviewer «src изменён, доки нет → REQUEST_CHANGES») (AC-4) | test_role_anti_regress_markers ×6 |
PASS |
| TC-08 | Валидность frontmatter промптов: YAML-mapping, name==роль, description непуст, нет model: (AC-8) |
test_agent_frontmatter_no_model.py ×12 |
PASS |
| TC-09 | A/B-проверка старый vs новый промпт «не хуже» (AC-6) | in-vivo (см. ниже) | PASS |
| TC-10 | Полный регресс pytest tests/ -q зелёный (AC-9) |
весь набор | PASS |
Структурные тесты промптов: 44 passed (test_agent_prompts_canon.py 32 + test_agent_frontmatter_no_model.py 12).
AC-5 — код/гейты не тронуты (сверка git)
Feature-коммит e155b01 затрагивает ровно: 6 промптов .openclaw/agents/*.md, CHANGELOG.md,
CLAUDE.md, tests/test_agent_prompts_canon.py, tests/manual/ab_prompt_compare.md.
git show e155b01 | grep '^src/' → пусто (ни один src/** не изменён). ✅
TC-09 — A/B-проверка (in-vivo, по tests/manual/ab_prompt_compare.md)
Промпт cat-ается из worktree ветки в момент запуска агента → стадии review и testing
самой ORCH-077 исполнились уже под новыми промптами (естественный A/B без отдельного стенда
и без рестарта прод-контейнера 8500).
- Стадия сравнения —
reviewиtestingORCH-077 (репрезентативные). - Число циклов
REQUEST_CHANGESна задаче — 0 (review сразуAPPROVED, 0× P0/P1). Не выросло относительно типичного для docs-задачи (ожидаемо 0–1). - Полнота артефакта —
12-review.mdнесёт все секции + 6-польную frontmatter-схему 52c;13-test-report.md(этот файл) — таблицу TC, вывод pytest, frontmatter-схему 52c. - Парсимость машинного вердикта —
verdict: APPROVEDпрочитан гейтом review корректно;result: PASSниже читаетсяcheck_tests_passed(имя/регистр ключа не изменены).
Вывод A/B: новый промпт не хуже старого — содержание не потеряно, вердикты парсятся,
циклов REQUEST_CHANGES не прибавилось → PASS.
Вывод pytest
$ python -m pytest tests/ -q --tb=short
........................................................................ [ 5%]
... (срез ради краткости) ...
.................... [100%]
1244 passed, 1 warning in 34.23s
Единственный warning — PydanticDeprecatedSince20 в src/config.py:5 (предсуществующий, не
относится к ORCH-077; код не менялся).
$ python -m pytest tests/test_agent_prompts_canon.py tests/test_agent_frontmatter_no_model.py -v
44 passed, 1 warning in 0.42s
Итог
PASS — все 10 TC зелёные, полный регресс 1244 passed, smoke API OK, src/** не тронут,
machine-verdict ключи сохранены, A/B «не хуже» подтверждён. Задача переходит на deploy-staging.