diff --git a/pipeline/iteration-log.md b/pipeline/iteration-log.md index 5a8b5a0..dc8a028 100644 --- a/pipeline/iteration-log.md +++ b/pipeline/iteration-log.md @@ -155,3 +155,19 @@ 2. Retry GX019817 après update 3. Start stage06_align preparation (pose extraction pipeline) 4. Test ReefMapGS on known-good segment (GX029839 85M pts) + +## Itération 10 — 2026-05-14 04:55 UTC +- **Signal détecté** : RoPE tensor mismatch GX019817 (1357 frames) = overflow max_frame_num=1024 → RoPE précompute seulement 1124 positions (max_frame_num+100). Source confirmée : `aggregator/stream.py` ligne 226 `max_total_frames=self.max_frame_num+100=1124 < 1357`. +- **Patch** : + - AUTO-COMMIT 2611a72 : `thresholds.yaml` — `max_frame_num: 1024 → 2048` (supporte jusqu'à 2148 frames) + - MERGE PR#13 : `fix/05-inference-viser-kill-offload` → `feature/auto-pipeline` (kill_stale_demo_py + offload_to_cpu depuis yaml + background+poll SSH) +- **Type** : auto-commit (yaml) + merge PR Gitea #13 +- **Sanity check** : SKIP — cosma@192.168.0.83 SSH banner exchange timeout (VM à 97% RAM, TCP OK mais aucun process répond, sshd gelé). Retry GX019817 impossible jusqu'à rétablissement .83. +- **Infrastructure** : 4 orphelins viser_ply.py tués sur .84 (libéré ~29GB RAM). VM .83 inaccessible — bloquer retry pipeline. +- **Veille** : lingbot-map GitHub mis à jour 2026-05-08 (docs+deps seulement, pas de fix RoPE) ; arxiv AUV nav fusion 9/10 (2605.04672) ; VGGT CVPR 2025 7/10 +- **Bloquants** : cosma@.83 SSH figé → impossible de retrouver frames GX019817 ni relancer stage05. Nécessite intervention humaine (.83 sshd restart ou VM reset). +- **Suggestion prochaine** : + 1. ⚠️ Intervention : débloquer SSH .83 (restart sshd ou VM reset via Proxmox) + 2. Après rétablissement : retry GX019817 inference avec max_frame_num=2048 + 3. Si .83 reste mort : cloner lingbot-map sur workspace → push Gitea → update .84/.87 depuis réseau local (les workers ne peuvent pas atteindre GitHub) + 4. Évaluer ReefMapGS v0.8 (underwater-specific) sur GX029839 (85M pts référence)