VLA 線 · 查看同日 AI 報告 →查看同日 AI 报告 →

2026-05-01

VLA 研究日報 Pulsar

LIVE

— AI 線今日無資料 —— AI 线今日无资料 —

VLA 線VLA 线 · cs.RO · cs.AI · cs.LG

Demonstrate once, execute on many: Kinematic intelligence for cross-robot skill transfer Sthithpragya Gupta et al. · 提出运动智能框架，实现单次演示跨机器人技能迁移。解决异构平台泛化瓶颈，提供可复用的跨形态控制策略。 SCIENCE-
A careful examination of large behavior models for multitask dexterous manipulation Jose Barreiros et al. · 深入分析大型行为模型在灵巧操作中的表现与局限。虽无新算法，但为VLA在精细操作中的应用提供重要实证参考。 SCIENCE-
DAIMON Robotics Wants to Give Robot Hands a Sense of Touch [Google DeepMind] Sujeet Dutta · 介绍Daimon-Infinity数据集，强调高分辨率触觉传感。填补触觉VLA数据空白，但属新闻综述而非技术论文。 IEEE-SPE
3D Generation for Embodied AI and Robotic Simulation: A Survey Tianwei Ye et al. · 综述3D生成在具身智能仿真中的应用。涵盖广泛但无具体新方法，适合作为背景阅读了解数据合成趋势。 CS.RO
STARRY: Spatial-Temporal Action-Centric World Modeling for Robotic Manipulation Yuxuan Tian et al. · 提出时空动作中心世界模型STARRY，增强VLA对交互结构的推理。填补动态空间建模空白，提升长程操作泛化。 CS.RO
R2RGEN: Real-to-Real 3D Data Generation for Spatially Generalized Manipulation [清华] Xiuwei Xu et al. · 通过实到实3D数据生成解决空间泛化问题。提供无需仿真的数据增强路径，可直接用于提升VLA鲁棒性。 CS.RO
FASTER: Rethinking Real-Time Flow VLAs Yuxiang Lu et al. · 优化VLA实时推理延迟，关注环境反应滞后而非仅轨迹平滑。提供低延迟部署的工程洞见，适合边缘设备集成。 CS.RO
Open-H-Embodiment: A Large-Scale Dataset for Enabling Foundation Models in Medical Robotics Open-H-Embodiment Consortium et al. · 发布医疗机器人大规模数据集。虽重要但属垂直领域数据贡献，通用VLA研究者需评估其迁移价值。 CS.RO
Inferix: A Block-Diffusion based Next-Generation Inference Engine for World Simulation Inferix Team et al. · 提出块扩散推理引擎用于世界模拟。侧重生成效率，与VLA控制闭环的直接关联较弱，暂归为相关工具。 CS.AI
Value-Guided Iterative Refinement and the DIQ-H Benchmark for Evaluating VLM Robustness Hanwen Wan et al. · 引入DIQ-H基准评估VLM鲁棒性。聚焦感知层评估而非动作策略，对VLA端到端训练的直接指导有限。 CS.AI
Multiple Consistent 2D-3D Mappings for Robust Zero-Shot 3D Visual Grounding Yufei Yin et al. · 改进零样本3D视觉定位的映射一致性。属感知基础能力，虽有用但未结合语言动作策略，非核心VLA。 CS.CV
World2VLM: Distilling World Model Imagination into VLMs for Dynamic Spatial Reasoning 将世界模型想象力蒸馏至VLM以增强动态空间推理。提升VLM对时序变化的理解，直接增强VLA感知模块。 HF-PAPER

2026-05-01

VLA 研究日報VLA 研究日报

8 篇 10 篇共 18 篇

🔧 技術技术

Practical VLA 2026-05-01

Demonstrate once, execute on many: Kinematic intelligence for cross-robot skill transfer

Sthithpragya Gupta et al. · 提出运动智能框架，实现单次演示跨机器人技能迁移。解决异构平台泛化瓶颈，提供可复用的跨形态控制策略。

Science-Robotics 閱讀原文

Practical VLA 2026-05-01

STARRY: Spatial-Temporal Action-Centric World Modeling for Robotic Manipulation

Yuxuan Tian et al. · 提出时空动作中心世界模型STARRY，增强VLA对交互结构的推理。填补动态空间建模空白，提升长程操作泛化。

cs.RO 閱讀原文

Practical VLA [清华] 2026-05-01

R2RGEN: Real-to-Real 3D Data Generation for Spatially Generalized Manipulation

Xiuwei Xu et al. · 通过实到实3D数据生成解决空间泛化问题。提供无需仿真的数据增强路径，可直接用于提升VLA鲁棒性。

cs.RO 閱讀原文

Practical VLA 2026-05-01

FASTER: Rethinking Real-Time Flow VLAs

Yuxiang Lu et al. · 优化VLA实时推理延迟，关注环境反应滞后而非仅轨迹平滑。提供低延迟部署的工程洞见，适合边缘设备集成。

cs.RO 閱讀原文

Practical VLA 2026-05-01

World2VLM: Distilling World Model Imagination into VLMs for Dynamic Spatial Reasoning

将世界模型想象力蒸馏至VLM以增强动态空间推理。提升VLM对时序变化的理解，直接增强VLA感知模块。

hf-papers 閱讀原文

Practical VLA 2026-05-01

EvolvingAgent: Curriculum Self-evolving Agent with Continual World Model for Long-Horizon Tasks

Tongtong Feng et al. · 结合课程学习与持续世界模型实现代理自进化。解决长程任务依赖人工数据的问题，提供Agentic VLA新范式。

cs.RO 閱讀原文

Practical VLA 2026-05-01

ViTaPEs: Visuotactile Position Encodings for Cross-Modal Alignment in Multimodal Transformers

Fotios Lygerakis et al. · 提出视触位置编码ViTaPEs优化多模态Transformer对齐。填补触觉VLA中时空对齐的技术空白，即插即用。

cs.RO 閱讀原文

Practical VLA [Berkeley|Darrell] 2026-05-01

Lifting Embodied World Models for Planning and Control

Alex N. Wang et al. · 提出提升具身世界模型以支持高层规划与控制。解决高维动作空间建模难题，为VLA提供分层控制新思路。

cs.AI 閱讀原文

📖 背景閱讀背景阅读

Background VLA 2026-05-01

A careful examination of large behavior models for multitask dexterous manipulation

Jose Barreiros et al. · 深入分析大型行为模型在灵巧操作中的表现与局限。虽无新算法，但为VLA在精细操作中的应用提供重要实证参考。

Science-Robotics 閱讀原文

Background VLA [Google DeepMind] 2026-05-01

DAIMON Robotics Wants to Give Robot Hands a Sense of Touch

Sujeet Dutta · 介绍Daimon-Infinity数据集，强调高分辨率触觉传感。填补触觉VLA数据空白，但属新闻综述而非技术论文。

ieee-spectrum-robotics 閱讀原文

Background VLA 2026-05-01

3D Generation for Embodied AI and Robotic Simulation: A Survey

Tianwei Ye et al. · 综述3D生成在具身智能仿真中的应用。涵盖广泛但无具体新方法，适合作为背景阅读了解数据合成趋势。

cs.RO 閱讀原文

Background VLA 2026-05-01

Open-H-Embodiment: A Large-Scale Dataset for Enabling Foundation Models in Medical Robotics

Open-H-Embodiment Consortium et al. · 发布医疗机器人大规模数据集。虽重要但属垂直领域数据贡献，通用VLA研究者需评估其迁移价值。

cs.RO 閱讀原文

Background VLA 2026-05-01

Inferix: A Block-Diffusion based Next-Generation Inference Engine for World Simulation

Inferix Team et al. · 提出块扩散推理引擎用于世界模拟。侧重生成效率，与VLA控制闭环的直接关联较弱，暂归为相关工具。

cs.AI 閱讀原文

Background VLA 2026-05-01

Value-Guided Iterative Refinement and the DIQ-H Benchmark for Evaluating VLM Robustness

Hanwen Wan et al. · 引入DIQ-H基准评估VLM鲁棒性。聚焦感知层评估而非动作策略，对VLA端到端训练的直接指导有限。

cs.AI 閱讀原文

Background VLA 2026-05-01

Multiple Consistent 2D-3D Mappings for Robust Zero-Shot 3D Visual Grounding

Yufei Yin et al. · 改进零样本3D视觉定位的映射一致性。属感知基础能力，虽有用但未结合语言动作策略，非核心VLA。

cs.CV 閱讀原文

Background VLA 2026-05-01

Continuum tactile sensing via an amplified liquid metal interface

Erlong Wang et al. · 新型液态金属连续触觉传感器硬件创新。虽支撑触觉VLA，但属硬件底层突破，非算法或模型层面进展。

Science-Advances 閱讀原文

Background VLA 2026-05-01

SD2AIL: Adversarial Imitation Learning from Synthetic Demonstrations via Diffusion Models

Pengcheng Li et al. · 利用扩散模型从合成数据中进行对抗模仿学习。方法通用但缺乏针对VLA特性的专门验证，相关性中等。

cs.RO 閱讀原文

Background VLA 2026-05-01

Curiosity-Critic: Cumulative Prediction Error Improvement as a Tractable Intrinsic Reward for World Model Training

Vin Bhaskara et al. · 提出基于累积预测误差改进的好奇心奖励。优化世界模型训练，但主要面向强化学习背景，VLA直接应用需转化。

cs.AI 閱讀原文

首頁首页 / VLA 日報VLA 日报 / 2026-05-01