From 5b4ba622fe1152ce8c951b8b7c516aea8c172a13 Mon Sep 17 00:00:00 2001 From: Stream Date: Mon, 15 Jun 2026 09:40:01 +0300 Subject: [PATCH] auto-sync: 2026-06-15 09:40:01 --- memory/2026-06-15.md | 16 ++++++++++++++++ 1 file changed, 16 insertions(+) diff --git a/memory/2026-06-15.md b/memory/2026-06-15.md index 96f0e39..4e98576 100644 --- a/memory/2026-06-15.md +++ b/memory/2026-06-15.md @@ -38,3 +38,19 @@ - Plane сам был жив: сайт и API отвечали 200, контейнеры Up. - Если у одного провайдера не открывается, а у другого открывается — вероятная причина DNS/маршрут/IPv6/фильтрация у провайдера, не Plane. + +## 2026-06-15 — ORCH-111 / reaper гонка / ORCH-113 + +- Разобран инцидент повторной обработки `deploy-staging` у ORCH-111: + - `deployer` успешно завершил агентскую часть (`exit_code=0`, staging log SUCCESS), но job ещё оставался `running`, потому что live-monitor/finalizer продолжал тяжёлую послеагентную финализацию: комментарии, stage transition, security-gate, merge-gate, re-test, prod-deploy. + - `job-reaper` через grace ~300s решил, что это «exit0 but finalizer died», и повторно запустил финализацию deploy-staging. + - Из-за этого параллельно пошли повторные security/merge-gate/re-test; повторный local re-test стал красным и откатил задачу `deploy-staging → development`, пока оригинальная финализация уже доводила prod-deploy до SUCCESS. + - Ключевой вывод: 300s grace недостаточен для тяжёлых deploy-staging финализаций; reaper не должен повторно дёргать stage finalization, пока оригинальный monitor/finalizer ещё жив или есть активный lease/heartbeat финализации. +- ORCH-111 в итоге стала `done`: + - prod deploy был уже выполнен успешно; последующий developer run после отката не внёс кодовых изменений/коммита. + - finalizer увидел, что нужные post-deploy/prod артефакты уже успешны, и задача дозавершилась. + - В БД: task ORCH-111 `stage=done`, updated_at `2026-06-15 06:14:26`; был создан/queued post-deploy-monitor job. +- По просьбе Славы заведена новая urgent bug-task: + - **ORCH-113** — `BUG: job-reaper must not re-run deploy-staging finalization while original finalizer is alive` + - Plane/work item id: `ORCH-113`, UUID `b9fcbeef-00cd-47fc-9874-2ace9b70b7e9`, state `Backlog`, priority `urgent`. + - Суть: запретить ситуацию, где reaper считает job потерянной и повторно запускает deploy-staging/merge-gate, пока оригинальная финализация всё ещё выполняется и может успешно довести задачу до prod/done.