Demonstrate once, execute on many: Kinematic intelligence for cross-robot skill transfer
Sthithpragya Gupta et al. · 提出运动智能框架,实现单次演示跨机器人技能迁移。解决异构平台泛化瓶颈,提供可复用的跨形态控制策略。
Sthithpragya Gupta et al. · 提出运动智能框架,实现单次演示跨机器人技能迁移。解决异构平台泛化瓶颈,提供可复用的跨形态控制策略。
Yuxuan Tian et al. · 提出时空动作中心世界模型STARRY,增强VLA对交互结构的推理。填补动态空间建模空白,提升长程操作泛化。
Xiuwei Xu et al. · 通过实到实3D数据生成解决空间泛化问题。提供无需仿真的数据增强路径,可直接用于提升VLA鲁棒性。
Yuxiang Lu et al. · 优化VLA实时推理延迟,关注环境反应滞后而非仅轨迹平滑。提供低延迟部署的工程洞见,适合边缘设备集成。
将世界模型想象力蒸馏至VLM以增强动态空间推理。提升VLM对时序变化的理解,直接增强VLA感知模块。
Tongtong Feng et al. · 结合课程学习与持续世界模型实现代理自进化。解决长程任务依赖人工数据的问题,提供Agentic VLA新范式。
Fotios Lygerakis et al. · 提出视触位置编码ViTaPEs优化多模态Transformer对齐。填补触觉VLA中时空对齐的技术空白,即插即用。
Alex N. Wang et al. · 提出提升具身世界模型以支持高层规划与控制。解决高维动作空间建模难题,为VLA提供分层控制新思路。
Jose Barreiros et al. · 深入分析大型行为模型在灵巧操作中的表现与局限。虽无新算法,但为VLA在精细操作中的应用提供重要实证参考。
Sujeet Dutta · 介绍Daimon-Infinity数据集,强调高分辨率触觉传感。填补触觉VLA数据空白,但属新闻综述而非技术论文。
Tianwei Ye et al. · 综述3D生成在具身智能仿真中的应用。涵盖广泛但无具体新方法,适合作为背景阅读了解数据合成趋势。
Open-H-Embodiment Consortium et al. · 发布医疗机器人大规模数据集。虽重要但属垂直领域数据贡献,通用VLA研究者需评估其迁移价值。
Inferix Team et al. · 提出块扩散推理引擎用于世界模拟。侧重生成效率,与VLA控制闭环的直接关联较弱,暂归为相关工具。
Hanwen Wan et al. · 引入DIQ-H基准评估VLM鲁棒性。聚焦感知层评估而非动作策略,对VLA端到端训练的直接指导有限。
Yufei Yin et al. · 改进零样本3D视觉定位的映射一致性。属感知基础能力,虽有用但未结合语言动作策略,非核心VLA。
Erlong Wang et al. · 新型液态金属连续触觉传感器硬件创新。虽支撑触觉VLA,但属硬件底层突破,非算法或模型层面进展。
Pengcheng Li et al. · 利用扩散模型从合成数据中进行对抗模仿学习。方法通用但缺乏针对VLA特性的专门验证,相关性中等。
Vin Bhaskara et al. · 提出基于累积预测误差改进的好奇心奖励。优化世界模型训练,但主要面向强化学习背景,VLA直接应用需转化。