admin/wiki

Files

Stream 143f9ad259 auto-sync: 2026-05-15 00:50:01

2026-05-15 00:50:01 +03:00

20 KiB

Raw Blame History

03. Quality Gates (QG)

Назначение: превратить «согласовать у Иванова» в машинно-проверяемые ворота между этапами. Без зелёного QG задача физически не может уйти на следующий этап — git hook и CI этого не позволят.

Простым языком

Quality Gate — это шлагбаум на выходе с каждого этапа. Шлагбаум открывает не человек, а робот, который проверяет:

лежат ли все нужные файлы там, где они должны лежать;
проходят ли они формальную проверку (валидный YAML, заполненные секции, ссылки на оригиналы);
зелёный ли CI;
поставил ли кто-то нужный «штамп» (reaction :approved: в Plane от пользователя с правом утверждения).

Если что-то не так — робот не пускает дальше и возвращает задачу с конкретным списком замечаний. Никакого «договорились в чате», никакого «потом доделаем».

Это и есть главная защита от того, что агент сам себе поставит галочку «готово».

Принципы QG

Всё машинно-проверяемо. Если критерий нельзя проверить скриптом или линтером — это не QG, а пожелание.
Каждое QG имеет владельца. «Кто чинит, если QG красный» — однозначно (см. таблицу ниже).
QG не пропускается. Нет режима «давайте этот раз без проверки». Если действительно есть исключительный случай — заводится отдельная процедура qg-override с явным человеческим approve и записью в audit-лог.
Reactions — это допустимая форма подписи. :approved: от пользователя с ролью Stakeholder в комментарии Plane или PR — валидный «штамп». Их собирает CI через API.
Обратная совместимость не оправдание. Если изменение требует апдейта CLAUDE.md, миграции, новой переменной окружения — она часть QG, не «потом».
Время на QG ограничено. Если QG висит красный больше SLA — эскалация в Plane.

Сводная таблица всех QG

QG	Между этапами	Чья ответственность	Чем проверяется	SLA до устранения
QG-0	Inception → Analysis	Webhook handler	`plane-webhook-validator`	n/a (синхронно)
QG-1	Analysis → Architecture	Analyst	`lint-spec.sh` + reaction-checker	24h
QG-2	Architecture → Design/Dev	Architect	`lint-adr.sh` + req-coverage	24h
QG-3	Design → Development	Designer	`lint-design.sh` + token-check	24h
QG-4	Development → Review	Developer	CI: lint+type+unit+integration+build	8h
QG-5	Review → Test	Reviewer	GitHub/Gitea API: approve + 0 unresolved	4h
QG-6	Test → Deploy	Tester	CI на preview: e2e + visual + a11y + perf	8h
QG-7	Deploy (test) → Deploy (prom)	Deployer/CI	smoke + healthcheck + user approval	4h
QG-final	Done	Deployer/CI	uptime 10min + user `:approved:` финала	1h

QG-0: Постановка → Анализ

Что проверяет: валидность Work Item в Plane.

Технически:

title существует, длина 5–80 символов
description существует, ≥3 предложений (≥150 символов)
project валиден (есть в Plane)
priority ∈ {low, medium, high, urgent}
(опционально) labels соответствуют известному словарю (area:*, type:*)

Реализация: Plane webhook → scripts/plane-webhook-validator.py. При успехе — создаются ветка и подзадачи. При неуспехе — Work Item получает комментарий «не хватает X», статус blocked.

Кто чинит: заказчик (человек) дополняет Work Item.

QG-1: Анализ → Архитектура

Что проверяет: артефакты этапа Анализа полны и согласованы.

Машинные проверки (scripts/lint-spec.sh + scripts/lint-test-plan.sh):

Обязательные файлы существуют:

docs/work-items/<id>/01-brd.md
docs/work-items/<id>/02-trz.md
docs/work-items/<id>/03-acceptance-criteria.md
docs/work-items/<id>/04-test-plan.yaml

Frontmatter валиден:

type соответствует имени файла (type: brd для 01-brd.md и т.д.)
plane_id совпадает с папкой
status: approved для всех

Семантические проверки:

В 02-trz.md каждое REQ- встречается ≥1 раз
В 03-acceptance-criteria.md для каждого REQ-F-* есть хотя бы один AC- со ссылкой [REQ-F-N]
В 04-test-plan.yaml для каждого AC- есть хотя бы один TC- (поле coverage)
Все ссылки из frontmatter related: указывают на существующие файлы

Бизнес-проверки (от человека):

На подзадаче «Анализ» в Plane стоит reaction :approved: от пользователя с ролью Stakeholder

Реализация: GitHub Action job qg-analysis, триггер — push в ветку feature/<id>-* ИЛИ комментарий в Plane с подписью.

Что делать если красный: агент-Analyst исправляет, делает новый коммит. CI пере-проверяет.

QG-2: Архитектура → (Дизайн или Разработка)

Что проверяет: архитектурные решения зафиксированы и покрывают требования.

Машинные проверки (scripts/lint-adr.sh + scripts/req-coverage.py):

ADR-проверки:

В docs/work-items/<id>/06-adr/ есть хотя бы один файл adr-NNNN-*.md
Каждый ADR имеет валидный frontmatter (adr_id, status, date, authors)
Каждый ADR имеет секции: ## Context, ## Decision, ## Alternatives considered, ## Consequences
superseded_by (если есть) указывает на существующий ADR

Покрытие требований:

Скрипт req-coverage.py собирает все REQ- из ТЗ и проверяет, что для каждого:
- либо есть упоминание в ADR данной задачи,
- либо есть явная пометка в 06-adr/no-decision-needed.md со списком таких REQ.
Если есть «голые» REQ — QG красный.

Диаграммы:

Все .mmd в docs/architecture/ рендерятся без ошибок (Mermaid CLI).

UI-флаг:

Если в ТЗ ui_affected: true, обязателен файл 09-ui-requirements.md. Если false — Designer-этап автозакрывается с лейблом skip:not-applicable.

Инфраструктура:

Если 07-infra-requirements.md упоминает новые сервисы/переменные — .env.example и docker-compose.yml уже обновлены (CI проверяет diff).

Реализация: GitHub Action job qg-architecture. При зелёном — лейбл PR меняется на stage:design или stage:dev (в зависимости от UI-флага).

Что делать если красный: Architect добавляет недостающие ADR / уточнения.

QG-3: Дизайн → Разработка (опциональный)

Что проверяет: дизайн полный и соответствует UI-требованиям.

Машинные проверки (scripts/lint-design.sh):

Файлы:

docs/work-items/<id>/11-design/wireframes.md
docs/work-items/<id>/11-design/mockups.md
docs/work-items/<id>/11-design/states.md
docs/work-items/<id>/11-design/a11y.md

Покрытие:

Каждое UI-требование из 09-ui-requirements.md упомянуто в mockups.md (по ID).

Состояния:

В states.md для каждого экрана описаны минимум: loading, empty, error, success. Если какое-то состояние неприменимо — явная пометка not-applicable: <причина>.

Дизайн-токены:

Линтер парсит mockups.md (если есть встроенные стили) и проверяет, что цвета/шрифты — только из docs/design/design-tokens.json. Любой произвольный hex/font — fail.

A11y чек-лист:

В a11y.md все обязательные пункты отмечены (контраст, ARIA, клавиатурная навигация, focus order).

Бизнес-approve:

Reaction :approved: от стейкхолдера на подзадаче «Дизайн» в Plane.

Реализация: GitHub Action job qg-design. Запускается, только если этап не skip:not-applicable.

Что делать если красный: Designer дорабатывает.

QG-4: Разработка → Code Review

Что проверяет: код, собирается, тесты зелёные, документация обновлена.

Машинные проверки (CI pipeline ci.yml):

Сборка и линт:

make lint — все линтеры (eslint, ruff, mypy, тип-чекеры) — без ошибок
make build — успешная сборка
Никаких новых TODO/FIXME в diff (linter no-new-todos.sh)

Тесты:

make test — все тесты зелёные
Покрытие: новый код имеет coverage ≥ 80% (check-coverage.sh)
Coverage delta всего проекта ≥ 0% (coverage-delta.sh сравнивает с main)

Безопасность:

trivy (контейнер): нет критичных CVE
bandit (Python) или npm audit (JS): нет критичных
secret-scan (gitleaks): нет утечек

Документация:

CHANGELOG.md обновлён (есть запись для этой задачи)
Если есть API-изменения — docs/api/openapi.yaml обновлён
CLAUDE.md актуален (если изменился стек или команды)

PR-правила:

Заполнен PR template (.github/PULL_REQUEST_TEMPLATE.md):
- ссылка на ТЗ ✓
- чек-лист DoD заполнен ✓
- заметка о breaking changes (даже если их нет — явное «нет») ✓
Лейбл stage:dev стоит
Размер PR ≤ 1500 строк diff (если больше — предупреждение, но не блокировка)

Реализация: GitHub Action ci.yml — обязательная проверка на PR.

Что делать если красный: Developer чинит.

QG-5: Code Review → Test

Что проверяет: ревью прошло, нет открытых вопросов.

Машинные проверки (Forge API через scripts/check-review.sh):

В PR хотя бы 1 review со статусом APPROVED
Reviewer ≠ Developer (проверка через автора коммитов и автора review)
0 review-комментариев в статусе unresolved
В docs/work-items/<id>/12-review.md есть запись с вердиктом approved
Frontmatter 12-review.md содержит:
- reviewer_findings: список (P0/P1 = blocker; P2/P3 — допустимы и описаны)
- compliance_with_trz: true
- compliance_with_adr: true

Если Reviewer-агент даёт request-changes — PR возвращается в stage:dev.

Реализация: GitHub Action qg-review запускается на event pull_request_review.

Что делать если красный: Developer вносит правки.

QG-6: Тестирование → Внедрение

Что проверяет: полный регресс на preview-окружении, включая UI.

Машинные проверки (CI workflow preview.yml + qg-test.yml):

Окружение:

Preview-окружение поднялось из текущей ветки (Docker Compose в CI)
Healthcheck preview-сервиса зелёный

Функциональные тесты:

Все unit/integration ещё раз зелёные
Все e2e (Playwright) зелёные
Все TC из 04-test-plan.yaml запущены (по automation.tool и automation.file)

UI-тесты:

Visual regression: 0 нерассмотренных diff'ов (либо явное обновление baseline в коммите)
a11y (axe-core): 0 нарушений уровня A и AA
Cross-browser: e2e прошли в Chromium, Firefox, WebKit

Производительность (если есть NFR в ТЗ):

p95 latency не превышает порог из ТЗ
Lighthouse score (для UI) ≥ согласованного

Безопасность:

Trivy / npm audit на собранном образе — нет критичных
Базовая OWASP-проверка через ZAP baseline (если применимо)

Артефакты:

docs/work-items/<id>/13-test-report.md создан, frontmatter verdict: pass
Скриншоты сохранены в 13-test-report/screenshots/
Логи CI прикреплены к PR

Баги:

Если найдены — заведены в Plane с лейблом bug:found-by-qa, привязаны к Work Item parent

Реализация: GitHub Action qg-test.yml, триггер — лейбл stage:test.

Что делать если красный: Tester заводит баги, PR возвращается в stage:dev. После фикса — снова QG-4 → QG-5 → QG-6.

QG-7: Внедрение в test → Внедрение в prom

Что проверяет: деплой в test прошёл корректно, smoke на test зелёный, есть человеческий approve.

Машинные проверки (deploy-test.yml + qg-deploy-test.sh):

Деплой:

merge в main выполнен (squash или rebase согласно проекту)
tag v<X.Y.Z> создан (semver на основе типа commit'а)
CI задеплоил в test-окружение без ошибок
Healthcheck test-окружения зелёный 5 минут после деплоя
Smoke-тесты на test зелёные (минимальный набор из tests/smoke/)

Approve:

В Plane на подзадаче «Внедрение» стоит reaction :approved: от пользователя с ролью Stakeholder (deployment approval)

Реализация: GitHub Action deploy-test.yml, далее ждёт approval-event из Plane.

Что делать если красный: Deployer-агент анализирует deploy log, при тривиальной проблеме — фикс и retry. При нетривиальной — эскалация (issue в Plane, лейбл incident).

QG-final: prom → Done

Что проверяет: prom стабилен после деплоя.

Машинные проверки (deploy-prom.yml + qg-final.sh):

Деплой:

CI задеплоил в prom без ошибок
Healthcheck prom-окружения зелёный 10 минут после деплоя
Smoke-тесты на prom зелёные
Метрики: error rate, latency не выросли больше чем на согласованный порог за 10-минутное окно
Нет открытых алёртов в Prometheus/Grafana (новых, привязанных по времени к деплою)

Финальный approve:

В Plane на Work Item стоит reaction :approved: от стейкхолдера (financial close)

При выполнении — Work Item автоматически закрывается, статус Done.

Override-процедура (исключения)

В исключительных случаях (например, hotfix во время инцидента) можно пропустить QG. Для этого:

В Plane создаётся отдельный Work Item типа qg-override с:
- parent = Work Item с проблемой
- description = причина override и список пропускаемых QG
- reaction :approved: от пользователя с ролью Owner workspace
Override логируется в docs/operations/qg-overrides.log (CI-скрипт пишет автоматически)
После инцидента — обязательная ретроспектива и закрытие override-Work Item с заполненным 13-test-report.md (т.е. техдолг учтён)

Override — не способ работать «быстрее». Это аварийный выход. Использование override чаще, чем 1 раз в месяц, — сигнал, что процесс сломан.

Метрики QG (для дашборда)

Снимаются автоматически из CI и Plane:

QG pass-rate first try — % случаев, когда QG прошёл с первой попытки. Цель: ≥80%.
Время простоя в красном QG — медиана и p95. Цель: p95 ≤ SLA.
QG retry count — сколько раз задача возвращалась на тот же этап. Цель: ≤2 для P1+ задач.
Override count — количество QG-override в месяц. Цель: ≤1.
Время от Inception до Done (lead time) — DORA метрика.

Эти метрики пишутся CI в Prometheus и визуализируются в Grafana (или отдельный простой дашборд на Plotly/Streamlit).

Чем эта схема отличается от «обычного DoD-чек-листа»

В типичной команде «Definition of Done» — это галочки в Confluence, которые ставит человек: «тесты написал ✓», «доку обновил ✓». Проблема: галочки ставит сам исполнитель, перед лицом дедлайна.

Здесь:

Галочка = результат автоматической проверки.
Кто ставит галочку — не имеет права изменить условия проверки в текущей задаче.
Reactions от человека — лимитированы только бизнес-approve (когда машина не может проверить); технические QG — целиком машинные.

Это и есть «ворота, которые нельзя забыть».

20 KiB Raw Blame History Unescape Escape