Skip to content
WEEKLY RECON | 2026.04.18 – 04.24

前瞻偵察前瞻侦察 · 2026年4月24日

意外信號意外信号 可證偽命題可证伪命题 觀察清單观察清单

2026-04-18 to 2026-04-24

VLA 週報

基於 VLA-Handbook 7 天系統數據

📌 回填說明:原 cron 48bb8537 (Fri 16:30) 在 2026-04-24 因 LLM 失敗寫入 57B 空殼。本期由 Claude Opus 4.7 從快照數據重建(原始 ⚡🔧 評級、theory 文章、field-state 均完整可查)。日期範圍與原計劃一致。weekly*.md 寫入路徑已加 200B 守衛(push-data-to-web.py f0ef04a),相同失敗模式不會再傳播。

TL;DR

  • 本周是 2026 春季 VLA 投稿洪峰:04-22 一日就有 21 篇 🔧 級論文(正常 4-7),整週 50+ 篇 ⚡🔧 涉足記憶、世界模型、安全、觸覺四大方向
  • 記憶架構成統一焦點:HELM (Harness-Enhanced Long-horizon Memory)、Gated Memory Policy、PhysMem (test-time physical memory)、Long-Term Memory for VLA-based Agents 四篇獨立工作從不同角度攻擊"VLA 即時映射缺陷"——這是領域共識正在凝結的明確信號
  • 觸覺研究強勢回歸:Multi-Modal Policy Consensus、OmniUMI(物理對齊多模態交互接口)、FingerEye(連續視觸覺感知)、On the Importance of Tactile(劃火柴實證)、ETac(輕量觸覺仿真)一周 5 篇——觸覺從邊緣議題重回主流

Spotlight

https://arxiv.org/abs/2510.XXXXX" target="_blank" rel="noopener noreferrer">WVA: World-Value-Action Model · Implicit Planning for VLA Systems

⚡ 04-18 唯一戰略級。將價值函數隱式規劃引入 VLA,挑戰直接動作預測缺乏推理能力的瓶頸。實測在雙臂 Piper 真機 75.6%——比 π0.5 (52-77%) 接近上限但更穩定。意義不在絕對數字,而在架構範式轉移:從 "policy = π(a|s)" 走向 "policy = argmax_a Q(s,a)"——VLA 從反應式控制器變成價值驅動規劃器。

https://arxiv.org/abs/2604.XXXXX" target="_blank" rel="noopener noreferrer">Towards Deploying VLA without Fine-Tuning

⚡ 04-18 第二戰略級。提出"具身進化擴散"作即插即用推理時策略引導,完全免微調部署。如果跨機器人實證成立,這是對"每個機器人都需要 200+ demos 微調"假設的根本性挑戰,可能讓 GR00T 類預訓 + 微調範式短壽。需要更多獨立復現驗證。

https://arxiv.org/abs/2604.XXXXX" target="_blank" rel="noopener noreferrer">HELM · Harness-Enhanced Long-horizon Memory

04-23/24 重複出現的 🔧——說明社區雙重關注(rate-vla 也兩次採樣)。針對 LIBERO 等 benchmark 的長程任務失敗問題,提出 harness 結構增強長期記憶。這是 vla_arch.md 中"VLA 即時映射缺陷"的第一個實質架構回應

方法族趨勢(field-state 2026-04-24)

| 方法族 | 7d | 加速度 | 趨勢 |

|--------|:--:|:------:|------|

| language_grounding | 40 | 1.05 | ◆ 穩定,仍是基座 |

| world_model | 22 | 0.76 | ▼ 減速 — 但本周 4 篇 🔧 集中爆發(Mask World Model · Cortex 2.0 · WVA · 後訓練綜述)|

| flow_matching | 20 | 0.99 | ◆ 穩定 |

| long_horizon | 20 | 0.99 | ◆ 穩定但質量躍升(HELM / Gated Memory / PhysMem 三件) |

| multi_task | 20 | 0.99 | ◆ 穩定 |

| tactile | 14 | 1.00 | ◆ 本週 5 篇集中 — 統計反映滯後 |

🧠 觀察:field-state 量化指標"穩定",但質量信號劇烈轉變——本週 long_horizon 不是更多論文而是收斂方向(記憶架構),tactile 不是新方向而是復興浪潮(從感知接口走到 VLA 整合)。純計數型 method-family-trend 對這類"質變"鈍感。

安全與魯棒性議題集中

四篇獨立工作攻擊 VLA 部署安全:

  • SafeVLA:通過約束學習實現安全對齊
  • ROBOGATE:兩階段邊界聚焦採樣自動發現失效模式
  • ReconVLA:不確定性引導 + 失敗感知框架
  • Rewind-IL:在線失敗檢測與狀態重生
  • Temporal Difference Calibration:序列任務不確定性校準

🧠 作者觀察:去年安全還是事後補丁,今年成 paper title 第一關鍵詞。配合 https://arxiv.org/abs/2510.03827" target="_blank" rel="noopener noreferrer">LIBERO-PRO 的扰動實證(標準 90%+ → 扰動 0%),VLA 社區正式承認"通用部署需要主動安全設計"。

跨域信號

最值得讀 / 最值得疑

最值得讀https://arxiv.org/abs/2604.XXXXX" target="_blank" rel="noopener noreferrer">HELM (Harness-Enhanced Long-horizon Memory) — 不靠堆 context length,而是結構化記憶。針對長程 LIBERO 任務直接驗證。如果你的 VLA 在 5+ 步任務上失敗率高,本週優先讀這篇。

最值得疑21 篇 🔧 spike 04-22。雖然每篇 reason 看起來都具體合理,但單日論文集中度異常值得追問:是 arxiv 投稿週期人為波動,還是 rate-vla 那天 calibration 偏鬆?建議下週 follow-up 看 rating 分佈是否回歸正常。本週 04-23 (6 🔧) + 04-24 (14 🔧) 顯示繼續高位,若 04-29 仍未回歸,需校準 prompt。

下週觀察清單

  1. HELM / Gated Memory Policy 是否在 LIBERO-PRO 扰動下守住記憶優勢? 標準 LIBERO 已知記憶化嚴重,記憶架構新工作必須報 PRO 數字
  2. WVA 真機 75.6% 在其他平台(非 Piper 雙臂)能否複現? 這是判斷"WVA = 範式 vs WVA = Piper 特技"的關鍵分水嶺
  3. 觸覺 5 篇集中是真趨勢還是 conference 投稿週期? 看 5 月第一週是否持續 ≥3 篇/週
  4. 0 ⚡ 連 6 天(04-19~24):本期 calibration 偏緊抑或 ICLR/ICML 截稿後真空期?04-29 雙週反思時應正面回答

📎 數據基礎:50+ ⚡🔧 papers across 04-18~24 · 30 篇新 theory articles · field-state 2026-04-24 snapshot · 30 days method-trend window

📡 完整 RSS feed:https://sou350121.github.io/pulsar-web/rss/vla-daily.xml" target="_blank" rel="noopener noreferrer">VLA 每日信號 · https://sou350121.github.io/pulsar-web/rss/vla-theory.xml" target="_blank" rel="noopener noreferrer">VLA 新文章