VLA 線 · 查看同日 AI 報告 →查看同日 AI 报告 →

2026-06-03

VLA 研究日報 Pulsar

LIVE

— AI 線今日無資料 —— AI 线今日无资料 —

VLA 線VLA 线 · cs.RO · cs.AI · cs.LG

World-Task Factorization for Robot Learning 提出策略的结构化分解以解决泛化问题，区分需重训练与保持纠缠的部分。属于理论探讨，缺乏具体VLA架构实现或基准测试对比。 HF-PAPER
RoboDream: Compositional World Models for Scalable Robot Data Synthesis 利用组合式世界模型生成大规模机器人演示数据，解决真实数据采集成本高的问题。提供可扩展的数据合成路径，可直接用于增强VLA训练数据集。 HF-PAPER
WALL-WM: Carving World Action Modeling at the Event Joints 将视频动作学习从块级优化转向事件基的VLA预训练，以语义连贯的动作事件为原子单位。提供了一种新的VLA预训练范式，有助于提升长程任务理解能力。 HF-PAPER
The Lie We Tell: Correcting the Euclidean Fallacy in Vision Language Action Policies via Score Matching on Tangent Space 指出扩散VLA中将SE(3)姿态表示为欧氏向量的几何错误，并在切空间进行分数匹配修正。解决了流形漂移问题，提升了姿态预测的几何一致性，代码可复用。 HF-PAPER
VLAMotor: Test-Guided Enhancement of Vision-Language-Action Models via Agent-BasedData Synthesis Zeqin Liao et al. · 通过基于代理的数据合成来增强VLA模型在边缘情况下的表现。方法涉及测试引导，但摘要未明确具体技术细节及在标准VLA基准上的显著优势。 CS.RO
From Human Videos to Robot Manipulation: A Survey on Scalable Vision-Language-Action Learning with Human-Centric Data Zhiyuan Feng et al. · 综述利用人类中心数据进行可扩展VLA学习的研究进展。作为综述文章，提供了领域概览但不包含新的算法贡献或即时可用的工程工具。 CS.RO
Can Predicted Dynamics Exist in the Physical World? Barak Or · 探讨物理AI系统中预测动态的物理可执行性，提出预测约束条件。侧重于理论分析与物理一致性验证，非直接针对VLA架构改进。 CS.RO
Silent Failures in Physical AI: A Literature Review of Runtime Action Authorization for Autonomous Systems Barak Or · 文献综述，回顾自主系统运行时动作授权中的静默失败问题。属于安全领域的综述，无具体VLA技术贡献或实验验证。 CS.RO
World Models for Robotic Manipulation: A Survey Fangyuan Wang et al. · 综述机器人操作中的世界模型研究，涵盖状态预测与未来演化。作为综述提供背景知识，无新方法或基准测试结果。 CS.RO
Completion at the Boundary (CaB): Deployable Switching with Completion-Aware Control under Limited Calibration Yusuke Sano et al. · 解决VLA代理在执行复合指令时的任务完成判断问题，提出完成感知控制切换机制。填补了VLA部署中操作接口缺失的空白，具有明确的工程应用价值。 CS.RO
Continuous Reasoning for Vision-Language-Action Yueh-Hua Wu et al. · 探讨自然语言推理粒度与连续控制之间的不匹配问题。主要关注理论层面的对齐，缺乏具体的VLA架构创新或基准实验支撑。 CS.RO
HOIST: Humanoid Optimization with Imitation and Sample-efficient Tuning for Manipulating Suspended Loads Songyang Liu et al. · 针对人形机器人操控悬挂负载的模仿学习与样本高效微调方法。专注于特定物理场景（悬挂负载），非通用VLA架构或训练范式改进。 CS.RO

2026-06-03

VLA 研究日報VLA 研究日报

19 篇 10 篇共 29 篇

🔧 技術技术

Practical VLA 2026-06-03

RoboDream: Compositional World Models for Scalable Robot Data Synthesis

利用组合式世界模型生成大规模机器人演示数据，解决真实数据采集成本高的问题。提供可扩展的数据合成路径，可直接用于增强VLA训练数据集。

hf-papers 閱讀原文

Practical VLA 2026-06-03

WALL-WM: Carving World Action Modeling at the Event Joints

将视频动作学习从块级优化转向事件基的VLA预训练，以语义连贯的动作事件为原子单位。提供了一种新的VLA预训练范式，有助于提升长程任务理解能力。

hf-papers 閱讀原文

Practical VLA 2026-06-03

The Lie We Tell: Correcting the Euclidean Fallacy in Vision Language Action Policies via Score Matching on Tangent Space

指出扩散VLA中将SE(3)姿态表示为欧氏向量的几何错误，并在切空间进行分数匹配修正。解决了流形漂移问题，提升了姿态预测的几何一致性，代码可复用。

hf-papers 閱讀原文

Practical VLA 2026-06-03

Completion at the Boundary (CaB): Deployable Switching with Completion-Aware Control under Limited Calibration

Yusuke Sano et al. · 解决VLA代理在执行复合指令时的任务完成判断问题，提出完成感知控制切换机制。填补了VLA部署中操作接口缺失的空白，具有明确的工程应用价值。

cs.RO 閱讀原文

Practical VLA 2026-06-03

Per-Group Error, Not Total MSE: Fine-Tuning Vision-Language-Action Models for 11-DoF Mobile Manipulation

Pau Montagut Bofi et al. · 揭示移动操作VLA微调中总MSE最低并非最佳性能的悖论，提出按组误差微调策略。提供了针对异构关节空间VLA微调的具体工程洞见，立即可用。

cs.RO 閱讀原文

Practical VLA 2026-06-03

PaCo-VLA: Passivity-Shielded Compliance Prior for Contact-Rich Vision-Language-Action Manipulation

Haofan Cao et al. · 引入被动屏蔽合规先验，解决VLA在接触丰富操作中的高频动力学安全问题。结合了高层语义与底层安全控制，提升了VLA在复杂接触任务中的鲁棒性。

cs.RO 閱讀原文

Practical VLA [Peking University] 2026-06-03

PACE: Phase-Aware Chunk Execution for Robot Policies with Action Chunking

Junnan Nie (Peking University) et al. · 针对动作分块策略提出相位感知执行机制，优化开环前缀执行后的重新查询时机。改进了VLA/Diffusion Policy的推理接口效率，具有明确的工程优化价值。

cs.RO 閱讀原文

Practical VLA 2026-06-03

Make Your VLA More Robust Without More Data By Interleaving Motion Planning

Dan BW Choe et al. · 通过 interleaving 运动规划增强VLA在长程任务中的鲁棒性，无需额外数据。提供了一种即插即用的推理阶段增强方案，有效解决VLA长程规划短板。

cs.RO 閱讀原文

Practical VLA 2026-06-03

LEGS: Fine-Tuning Teleop-Free VLAs for Humanoid Loco-manipulation in an Embodied Gaussian Splatting World

Hojune Kim et al. · 在 embodied Gaussian Splatting 世界中微调免遥操作VLA以实现人形机器人 loco-manipulation。解决了真机数据稀缺问题，利用新颖仿真环境提升迁移能力。

cs.RO 閱讀原文

Practical VLA 2026-06-03

Set-Supervised Diffusion Policy: Learning Action-Chunking Diffusion through Corrections

Zhaoting Li et al. · 提出集合监督扩散策略，通过修正学习动作分块扩散以应对分布偏移。改进了Diffusion Policy的训练目标，提升了对人类干预数据的利用效率。

cs.RO 閱讀原文

📖 背景閱讀背景阅读

Background VLA 2026-06-03

World-Task Factorization for Robot Learning

提出策略的结构化分解以解决泛化问题，区分需重训练与保持纠缠的部分。属于理论探讨，缺乏具体VLA架构实现或基准测试对比。

hf-papers 閱讀原文

Background VLA 2026-06-03

VLAMotor: Test-Guided Enhancement of Vision-Language-Action Models via Agent-BasedData Synthesis

Zeqin Liao et al. · 通过基于代理的数据合成来增强VLA模型在边缘情况下的表现。方法涉及测试引导，但摘要未明确具体技术细节及在标准VLA基准上的显著优势。

cs.RO 閱讀原文

Background VLA 2026-06-03

From Human Videos to Robot Manipulation: A Survey on Scalable Vision-Language-Action Learning with Human-Centric Data

Zhiyuan Feng et al. · 综述利用人类中心数据进行可扩展VLA学习的研究进展。作为综述文章，提供了领域概览但不包含新的算法贡献或即时可用的工程工具。

cs.RO 閱讀原文

Background VLA 2026-06-03

Can Predicted Dynamics Exist in the Physical World?

Barak Or · 探讨物理AI系统中预测动态的物理可执行性，提出预测约束条件。侧重于理论分析与物理一致性验证，非直接针对VLA架构改进。

cs.RO 閱讀原文

Background VLA 2026-06-03

Silent Failures in Physical AI: A Literature Review of Runtime Action Authorization for Autonomous Systems

Barak Or · 文献综述，回顾自主系统运行时动作授权中的静默失败问题。属于安全领域的综述，无具体VLA技术贡献或实验验证。

cs.RO 閱讀原文

Background VLA 2026-06-03

World Models for Robotic Manipulation: A Survey

Fangyuan Wang et al. · 综述机器人操作中的世界模型研究，涵盖状态预测与未来演化。作为综述提供背景知识，无新方法或基准测试结果。

cs.RO 閱讀原文

Background VLA 2026-06-03

Continuous Reasoning for Vision-Language-Action

Yueh-Hua Wu et al. · 探讨自然语言推理粒度与连续控制之间的不匹配问题。主要关注理论层面的对齐，缺乏具体的VLA架构创新或基准实验支撑。

cs.RO 閱讀原文

Background VLA 2026-06-03

HOIST: Humanoid Optimization with Imitation and Sample-efficient Tuning for Manipulating Suspended Loads

Songyang Liu et al. · 针对人形机器人操控悬挂负载的模仿学习与样本高效微调方法。专注于特定物理场景（悬挂负载），非通用VLA架构或训练范式改进。

cs.RO 閱讀原文

Background VLA 2026-06-03

SafeVLA-Bench: A Benchmark for the Success-Safety Gap in Vision-Language-Action Models

Jialiang Fan et al. · 发布评估VLA成功与安全差距的新基准，关注轨迹行为而非仅二元成功。重要数据集/基准贡献，但本身非算法改进，归类为值得了解。

cs.RO 閱讀原文

Background VLA 2026-06-03

Threading Optimization for Vision-Language-Action Model Inference in Low-Cost Smart Agricultural Manipulation

Keith Truongcao et al. · 针对低成本农业机械臂的VLA推理线程优化。属于特定硬件平台的工程优化，通用性有限，且未提出新的VLA模型架构。

cs.RO 閱讀原文

Background VLA 2026-06-03

$\tau_0$-WM: A Unified Video-Action World Model for Robotic Manipulation

Pengfei Zhou et al. · 提出统一视频-动作世界模型，整合动作生成与后果预测。虽标题含“统一”，但摘要未展示超越现有SOTA的基准结果，暂归为值得了解。

cs.RO 閱讀原文

Background VLA 2026-06-03

Position: Good Embodied Reward Models Need Bad Behavior Data

Ran Tian et al. · 观点论文，主张奖励模型训练需包含失败/次优数据。提供数据收集策略的理论依据，无具体算法实现或实验验证。

cs.RO 閱讀原文

Background VLA 2026-06-03

Learning Multi-Modal Trajectory Policies for Data-Efficient Robotic Manipulation

Zijia Chen et al. · 学习多模态轨迹策略以提高数据效率。方法描述较为笼统，未明确区别于现有Transformer-based policy的核心创新点及基准对比。

cs.RO 閱讀原文

Background VLA 2026-06-03

Beyond Task Success: Behavioral and Representational Diagnostics for WAM and VLA

Hung Mai et al. · 提供对WAM和VLA的行为与表征诊断工具，分析未来预测是否带来行为改善。属于分析与诊断工具，非直接的性能提升方法。

cs.RO 閱讀原文

Background VLA 2026-06-03

ImagineUAV: Aerial Vision-Language Navigation via World-Action Modeling and Kinodynamic Planning

Xuchen Liu et al. · 结合世界动作建模与运动学规划实现无人机视觉语言导航。聚焦于UAV特定领域，非通用地面操作VLA，应用场景受限。

cs.RO 閱讀原文

Background VLA 2026-06-03

OneVLA: A Unified Framework for Embodied Tasks

Lingfeng Zhang et al. · 提出统一导航与操作的VLA框架。标题宏大但摘要未详述技术突破，且“统一”类工作常为已有模块拼接，需警惕灌水风险。

cs.RO 閱讀原文

Background VLA 2026-06-03

Co-training with Ego-centric Video and Demonstration for Robot Navigation Task

Shoya Kuno et al. · 结合第一人称视频与演示数据进行机器人导航任务的协同训练。侧重导航任务，且方法为常见的多源数据融合，VLA核心贡献不明确。

cs.RO 閱讀原文

Background VLA 2026-06-03

Dexterity-BEV: Aligning 3D World and Actions for Generalizable Robot Policies Learning

Huayi Zhou et al. · 提出Dexterity-BEV对齐3D世界与动作以增强策略泛化。主要贡献在于特征表示层，未明确展示在标准VLA基准上相对于SOTA的显著优势。

cs.RO 閱讀原文

Background VLA 2026-06-03

RoboSemanticBench: Diagnosing Semantic Grounding in Action Prediction for VLA Models

Bin Yu et al. · 发布诊断VLA模型语义接地能力的基准RoboSemanticBench。作为评估工具重要，但非算法改进，归类为值得了解。

cs.RO 閱讀原文

首頁首页 / VLA 日報VLA 日报 / 2026-06-03