From 568ff9469b99fa7e16c6f49045bc8bcb278ec122 Mon Sep 17 00:00:00 2001 From: Poulpe Date: Thu, 14 May 2026 04:56:09 +0000 Subject: [PATCH] =?UTF-8?q?auto-iter=202026-05-14:=20iteration-log=20iter1?= =?UTF-8?q?0=20=E2=80=94=20RoPE=20fix=20+=20PR#13=20merge=20+=20.83=20bloc?= =?UTF-8?q?ker?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Co-Authored-By: Poulpe --- pipeline/iteration-log.md | 16 ++++++++++++++++ 1 file changed, 16 insertions(+) diff --git a/pipeline/iteration-log.md b/pipeline/iteration-log.md index 5a8b5a0..dc8a028 100644 --- a/pipeline/iteration-log.md +++ b/pipeline/iteration-log.md @@ -155,3 +155,19 @@ 2. Retry GX019817 après update 3. Start stage06_align preparation (pose extraction pipeline) 4. Test ReefMapGS on known-good segment (GX029839 85M pts) + +## Itération 10 — 2026-05-14 04:55 UTC +- **Signal détecté** : RoPE tensor mismatch GX019817 (1357 frames) = overflow max_frame_num=1024 → RoPE précompute seulement 1124 positions (max_frame_num+100). Source confirmée : `aggregator/stream.py` ligne 226 `max_total_frames=self.max_frame_num+100=1124 < 1357`. +- **Patch** : + - AUTO-COMMIT 2611a72 : `thresholds.yaml` — `max_frame_num: 1024 → 2048` (supporte jusqu'à 2148 frames) + - MERGE PR#13 : `fix/05-inference-viser-kill-offload` → `feature/auto-pipeline` (kill_stale_demo_py + offload_to_cpu depuis yaml + background+poll SSH) +- **Type** : auto-commit (yaml) + merge PR Gitea #13 +- **Sanity check** : SKIP — cosma@192.168.0.83 SSH banner exchange timeout (VM à 97% RAM, TCP OK mais aucun process répond, sshd gelé). Retry GX019817 impossible jusqu'à rétablissement .83. +- **Infrastructure** : 4 orphelins viser_ply.py tués sur .84 (libéré ~29GB RAM). VM .83 inaccessible — bloquer retry pipeline. +- **Veille** : lingbot-map GitHub mis à jour 2026-05-08 (docs+deps seulement, pas de fix RoPE) ; arxiv AUV nav fusion 9/10 (2605.04672) ; VGGT CVPR 2025 7/10 +- **Bloquants** : cosma@.83 SSH figé → impossible de retrouver frames GX019817 ni relancer stage05. Nécessite intervention humaine (.83 sshd restart ou VM reset). +- **Suggestion prochaine** : + 1. ⚠️ Intervention : débloquer SSH .83 (restart sshd ou VM reset via Proxmox) + 2. Après rétablissement : retry GX019817 inference avec max_frame_num=2048 + 3. Si .83 reste mort : cloner lingbot-map sur workspace → push Gitea → update .84/.87 depuis réseau local (les workers ne peuvent pas atteindre GitHub) + 4. Évaluer ReefMapGS v0.8 (underwater-specific) sur GX029839 (85M pts référence)