auto-sync: 2026-06-15 09:40:01
This commit is contained in:
@@ -38,3 +38,19 @@
|
||||
- Plane сам был жив: сайт и API отвечали 200, контейнеры Up.
|
||||
- Если у одного провайдера не открывается, а у другого открывается — вероятная причина DNS/маршрут/IPv6/фильтрация у провайдера, не Plane.
|
||||
|
||||
|
||||
## 2026-06-15 — ORCH-111 / reaper гонка / ORCH-113
|
||||
|
||||
- Разобран инцидент повторной обработки `deploy-staging` у ORCH-111:
|
||||
- `deployer` успешно завершил агентскую часть (`exit_code=0`, staging log SUCCESS), но job ещё оставался `running`, потому что live-monitor/finalizer продолжал тяжёлую послеагентную финализацию: комментарии, stage transition, security-gate, merge-gate, re-test, prod-deploy.
|
||||
- `job-reaper` через grace ~300s решил, что это «exit0 but finalizer died», и повторно запустил финализацию deploy-staging.
|
||||
- Из-за этого параллельно пошли повторные security/merge-gate/re-test; повторный local re-test стал красным и откатил задачу `deploy-staging → development`, пока оригинальная финализация уже доводила prod-deploy до SUCCESS.
|
||||
- Ключевой вывод: 300s grace недостаточен для тяжёлых deploy-staging финализаций; reaper не должен повторно дёргать stage finalization, пока оригинальный monitor/finalizer ещё жив или есть активный lease/heartbeat финализации.
|
||||
- ORCH-111 в итоге стала `done`:
|
||||
- prod deploy был уже выполнен успешно; последующий developer run после отката не внёс кодовых изменений/коммита.
|
||||
- finalizer увидел, что нужные post-deploy/prod артефакты уже успешны, и задача дозавершилась.
|
||||
- В БД: task ORCH-111 `stage=done`, updated_at `2026-06-15 06:14:26`; был создан/queued post-deploy-monitor job.
|
||||
- По просьбе Славы заведена новая urgent bug-task:
|
||||
- **ORCH-113** — `BUG: job-reaper must not re-run deploy-staging finalization while original finalizer is alive`
|
||||
- Plane/work item id: `ORCH-113`, UUID `b9fcbeef-00cd-47fc-9874-2ace9b70b7e9`, state `Backlog`, priority `urgent`.
|
||||
- Суть: запретить ситуацию, где reaper считает job потерянной и повторно запускает deploy-staging/merge-gate, пока оригинальная финализация всё ещё выполняется и может успешно довести задачу до prod/done.
|
||||
|
||||
Reference in New Issue
Block a user