Gated Memory Policy
Yihuai Gao et al. · 引入门控记忆机制处理非马尔可夫任务,通过动态调整历史窗口长度平衡计算效率与信息保留。该方法可直接集成至现有 VLA 模型中以提升长序列处理能力。
Yihuai Gao et al. · 引入门控记忆机制处理非马尔可夫任务,通过动态调整历史窗口长度平衡计算效率与信息保留。该方法可直接集成至现有 VLA 模型中以提升长序列处理能力。
Jean Mercat et al. · 开源统一框架 VLA Foundry,整合 LLM、VLM 和 VLA 训练流程,解决现有工具链碎片化问题。提供标准化接口和预置模块,显著降低 VLA 复现门槛,本周即可用于工程实践。
Haoyang Li et al. · 提出 PhysMem 机制,在测试时动态扩展物理属性记忆以增强 VLM 规划器对摩擦、稳定性等物理特性的预测能力。直接针对 VLA 物理常识缺失痛点,方法具明确应用路径。
Yuxuan Gao et al. · 提出基于漂移的策略优化方法,实现单步原生策略学习,避免扩散策略的多步去噪延迟。显著提升在线控制速度,为 VLA 实时部署提供高效替代方案,具高复用价值。
Zijian Zeng et al. · 针对 VLA 长程任务失败问题,提出 HELM 机制通过 harness 结构增强长期记忆保持。直接在 LIBERO 等基准上验证,解决了上下文扩展无效的瓶颈,属实质性架构改进。
Yunfan Lou et al. · 提出掩码世界模型,聚焦关键物理特征预测而非全像素重建,以提升策略鲁棒性。解决视频世界模型过拟合视觉细节的问题,可直接用于增强 VLA 的世界模型组件。
提出一种基于价值引导的采样方法以加速强化学习推理,减少测试时计算成本。虽与策略优化相关,但缺乏针对 VLA 架构或机器人操作的具体实验验证。
Feng Jiang et al. · 发布首个专门评估机器人操作中世界模型物理合理性的基准数据集。填补了当前仅关注视觉逼真度而忽视物理一致性的评估空白,对世界模型研究具有重要参考价值。
Hossein Gholampour et al. · 针对未知负载提出力矩感知导纳控制算法,解决质心偏移导致的操控不稳问题。属于传统控制领域改进,未涉及 VLA 或数据驱动策略,与核心研究方向关联较弱。
Boyu Chen et al. · 探索利用人类第一视角数据通过统一物理语言桥接人形机器人策略学习。旨在解决机器人数据稀缺问题,但摘要未展示具体跨形态迁移实验结果,需进一步验证有效性。
Zifan Xu et al. · 利用不完美的行为先验生成大规模仿真专家数据,进而实现 Sim-to-Real 策略迁移。虽涉及数据生成,但重点在于 RL 数据扩充而非 VLA 架构创新,且缺乏真实机器人 VLA 对比。
Yiming Mao et al. · 提出优势奖励建模(ARM)以解决长程操作中的稀疏奖励信用分配问题。属于 RL 奖励设计改进,未明确结合 VLA 的多模态特性或在标准 VLA 基准上进行评估。
Jingjing Wang et al. · 利用图像编辑技术提取通用 3D 先验知识以辅助开放世界操作。方法新颖但主要依赖仿真或间接验证,缺乏在标准 VLA 基准上的端到端性能对比,暂归为值得了解。
Haoyu Wu et al. · 构建可扩展的多智能体多视角视频世界模型,模拟环境动态。虽与 embodied AI 相关,但侧重于视频生成与多智能体交互,未直接涉及 VLA 策略学习或操作任务。
Xun-En Wu et al. · 发表新型无芯片发光光纤触觉传感器,实现闭环触觉-视觉交互。属于硬件传感创新,虽对触觉 VLA 有潜在价值,但非算法或模型层面的进展,归为值得了解。
Byungseok Seo et al. · 介绍基于介电异质结伪导电界面设计的带时间戳触觉传感器。纯硬件传感技术论文,不涉及 VLA 算法、训练或推理,与核心研究方向无直接关联。
Simon Idoko et al. · 结合流匹配与微分优化解决多机器人集中式轨迹规划问题。属于运动规划与控制领域,未涉及视觉语言理解或 VLA 决策层,与 VLA 核心架构无关。
Vin Bhaskara et al. · 提出基于累积预测误差改进的好奇心奖励机制,用于世界模型训练。属于自监督学习奖励设计,虽可用于预训练,但未直接结合 VLA 操作任务进行验证。
Tongxin Li · 利用黎曼优化和世界模型实现安全关键的上下文控制。侧重控制理论与安全性保证,未涉及 VLA 的多模态语义理解或通用策略学习,相关性较低。
Zaishuo Xia et al. · 分析潜空间几何结构对长程世界模型克隆确定性世界的重要性。理论分析为主,探讨世界模型内在机理,对 VLA 研究者有启发,但非直接的方法论贡献。