2026-04-18 to 2026-04-24

VLA 週報

基於 VLA-Handbook 7 天系統數據

📌 回填說明：原 cron 48bb8537 (Fri 16:30) 在 2026-04-24 因 LLM 失敗寫入 57B 空殼。本期由 Claude Opus 4.7 從快照數據重建（原始 ⚡🔧 評級、theory 文章、field-state 均完整可查）。日期範圍與原計劃一致。weekly*.md 寫入路徑已加 200B 守衛（push-data-to-web.py f0ef04a），相同失敗模式不會再傳播。

TL;DR

本周是 2026 春季 VLA 投稿洪峰：04-22 一日就有 21 篇 🔧 級論文（正常 4-7），整週 50+ 篇 ⚡🔧 涉足記憶、世界模型、安全、觸覺四大方向
記憶架構成統一焦點：HELM (Harness-Enhanced Long-horizon Memory)、Gated Memory Policy、PhysMem (test-time physical memory)、Long-Term Memory for VLA-based Agents 四篇獨立工作從不同角度攻擊"VLA 即時映射缺陷"——這是領域共識正在凝結的明確信號
觸覺研究強勢回歸：Multi-Modal Policy Consensus、OmniUMI（物理對齊多模態交互接口）、FingerEye（連續視觸覺感知）、On the Importance of Tactile（劃火柴實證）、ETac（輕量觸覺仿真）一周 5 篇——觸覺從邊緣議題重回主流

Spotlight

https://arxiv.org/abs/2510.XXXXX" target="_blank" rel="noopener noreferrer">WVA: World-Value-Action Model · Implicit Planning for VLA Systems

⚡ 04-18 唯一戰略級。將價值函數隱式規劃引入 VLA，挑戰直接動作預測缺乏推理能力的瓶頸。實測在雙臂 Piper 真機 75.6%——比 π0.5 (52-77%) 接近上限但更穩定。意義不在絕對數字，而在架構範式轉移：從 "policy = π(a|s)" 走向 "policy = argmax_a Q(s,a)"——VLA 從反應式控制器變成價值驅動規劃器。

https://arxiv.org/abs/2604.XXXXX" target="_blank" rel="noopener noreferrer">Towards Deploying VLA without Fine-Tuning

⚡ 04-18 第二戰略級。提出"具身進化擴散"作即插即用推理時策略引導，完全免微調部署。如果跨機器人實證成立，這是對"每個機器人都需要 200+ demos 微調"假設的根本性挑戰，可能讓 GR00T 類預訓 + 微調範式短壽。需要更多獨立復現驗證。

https://arxiv.org/abs/2604.XXXXX" target="_blank" rel="noopener noreferrer">HELM · Harness-Enhanced Long-horizon Memory

04-23/24 重複出現的 🔧——說明社區雙重關注（rate-vla 也兩次採樣）。針對 LIBERO 等 benchmark 的長程任務失敗問題，提出 harness 結構增強長期記憶。這是 vla_arch.md 中"VLA 即時映射缺陷"的第一個實質架構回應。

方法族趨勢（field-state 2026-04-24）

| 方法族 | 7d | 加速度 | 趨勢 |

|--------|:--:|:------:|------|

| language_grounding | 40 | 1.05 | ◆ 穩定，仍是基座 |

| world_model | 22 | 0.76 | ▼ 減速 — 但本周 4 篇 🔧 集中爆發（Mask World Model · Cortex 2.0 · WVA · 後訓練綜述）|

| flow_matching | 20 | 0.99 | ◆ 穩定 |

| long_horizon | 20 | 0.99 | ◆ 穩定但質量躍升（HELM / Gated Memory / PhysMem 三件） |

| multi_task | 20 | 0.99 | ◆ 穩定 |

| tactile | 14 | 1.00 | ◆ 本週 5 篇集中 — 統計反映滯後 |

🧠 觀察：field-state 量化指標"穩定"，但質量信號劇烈轉變——本週 long_horizon 不是更多論文而是收斂方向（記憶架構），tactile 不是新方向而是復興浪潮（從感知接口走到 VLA 整合）。純計數型 method-family-trend 對這類"質變"鈍感。

安全與魯棒性議題集中

四篇獨立工作攻擊 VLA 部署安全：

SafeVLA：通過約束學習實現安全對齊
ROBOGATE：兩階段邊界聚焦採樣自動發現失效模式
ReconVLA：不確定性引導 + 失敗感知框架
Rewind-IL：在線失敗檢測與狀態重生
Temporal Difference Calibration：序列任務不確定性校準

🧠 作者觀察：去年安全還是事後補丁，今年成 paper title 第一關鍵詞。配合 https://arxiv.org/abs/2510.03827" target="_blank" rel="noopener noreferrer">LIBERO-PRO 的扰動實證（標準 90%+ → 扰動 0%），VLA 社區正式承認"通用部署需要主動安全設計"。

跨域信號

04-22 Danfei Xu 訪談深度解讀入庫——Sensorimotor Ghost 框架對 EgoScale 路線的哲學支撐
04-23 World Model 輔助 VLA 後訓練入庫——本週 WVA + Mask World Model + Cortex 2.0 三篇集中響應
04-20 VLA 數據工程指南大幅深化——含 EgoScale + Egocentric 完整章節

可证伪命题 FALSIFIABLE HOOK

最值得讀 / 最值得疑

最值得讀：https://arxiv.org/abs/2604.XXXXX" target="_blank" rel="noopener noreferrer">HELM (Harness-Enhanced Long-horizon Memory) — 不靠堆 context length，而是結構化記憶。針對長程 LIBERO 任務直接驗證。如果你的 VLA 在 5+ 步任務上失敗率高，本週優先讀這篇。

最值得疑：21 篇 🔧 spike 04-22。雖然每篇 reason 看起來都具體合理，但單日論文集中度異常值得追問：是 arxiv 投稿週期人為波動，還是 rate-vla 那天 calibration 偏鬆？建議下週 follow-up 看 rating 分佈是否回歸正常。本週 04-23 (6 🔧) + 04-24 (14 🔧) 顯示繼續高位，若 04-29 仍未回歸，需校準 prompt。

观察清单 WATCH LIST

下週觀察清單

HELM / Gated Memory Policy 是否在 LIBERO-PRO 扰動下守住記憶優勢？ 標準 LIBERO 已知記憶化嚴重，記憶架構新工作必須報 PRO 數字
WVA 真機 75.6% 在其他平台（非 Piper 雙臂）能否複現？ 這是判斷"WVA = 範式 vs WVA = Piper 特技"的關鍵分水嶺
觸覺 5 篇集中是真趨勢還是 conference 投稿週期？ 看 5 月第一週是否持續 ≥3 篇/週
0 ⚡ 連 6 天（04-19~24）：本期 calibration 偏緊抑或 ICLR/ICML 截稿後真空期？04-29 雙週反思時應正面回答

///

📎 數據基礎：50+ ⚡🔧 papers across 04-18~24 · 30 篇新 theory articles · field-state 2026-04-24 snapshot · 30 days method-trend window

📡 完整 RSS feed：https://sou350121.github.io/pulsar-web/rss/vla-daily.xml" target="_blank" rel="noopener noreferrer">VLA 每日信號 · https://sou350121.github.io/pulsar-web/rss/vla-theory.xml" target="_blank" rel="noopener noreferrer">VLA 新文章