VLA 線 · 查看同日 AI 報告 →查看同日 AI 报告 →

2026-04-14

VLA 研究日報 Pulsar

LIVE

— AI 線今日無資料 —— AI 线今日无资料 —

VLA 線VLA 线 · cs.RO · cs.AI · cs.LG

AssemLM: Spatial Reasoning Multimodal Large Language Models for Robotic Assembly Zhi Jing et al. · 针对机器人装配任务的空间推理多模态模型，旨在解决细粒度操作中的空间感知问题。摘要未提及具体架构创新或真实机器人实验验证，暂归为值得了解。 CS.RO
V-CAGE: Vision-Closed-Loop Agentic Generation Engine for Robotic Manipulation Yaru Liu et al. · 提出视觉闭环代理生成引擎，通过上下文感知的场景生成方法合成高保真训练数据以扩展 VLA 模型。为 VLA 研究者提供了新的数据合成与增强路径，本周可尝试复现数据生成流程。 CS.RO
TouchAnything: Diffusion-Guided 3D Reconstruction from Sparse Robot Touches Langzhe Gu et al. · 利用扩散模型引导稀疏触觉信号进行 3D 重建，解决遮挡下的几何估计难题。直接服务于触觉 VLA 方向，提供了一套从稀疏触感到完整几何的可用工具链。 CS.RO
2D or 3D: Who Governs Salience in VLA Models? -- Tri-Stage Token Pruning Framework with Modality Salience Awareness Zihao Zheng et al. · 提出三阶段 Token 剪枝框架，动态评估 2D/3D 模态显著性以优化 MVLA 模型效率。为多模态 VLA 部署提供了具体的推理加速方案，代码有望快速集成。 CS.RO
PhysInOne: Visual Physics Learning and Reasoning in One Suite Siyuan Zhou et al. · 发布包含 200 万视频的大规模物理 grounding 合成数据集，旨在填补物理推理数据稀缺。属于重要数据资源，但非架构创新，适合长期关注而非紧急复用。 CS.RO
Dream to Fly: Model-Based Reinforcement Learning for Vision-Based Drone Flight Angel Romero et al. · 基于模型的强化学习用于无人机竞速，主要聚焦飞行控制与感知规划。虽涉及具身智能，但偏向特定飞行器控制而非通用 VLA 操作架构，相关性中等。 CS.RO
Dejavu: Towards Experience Feedback Learning for Embodied Intelligence Shaokai Wu et al. · 提出部署后经验反馈学习框架，使具身智能体能在真实环境中持续获取新知识并提升性能。解决了 VLA 模型部署后无法进化的痛点，具有明确的在线学习应用价值。 CS.RO
RESample: A Robust Data Augmentation Framework via Exploratory Sampling for Robotic Manipulation Yuquan Xue et al. · 通过探索性采样进行鲁棒数据增强的框架，旨在提升模仿学习效果。方法看似是对现有增强策略的组合优化，缺乏颠覆性创新，且摘要未展示显著 SOTA 超越。 CS.RO
Commanding Humanoid by Free-form Language: A Large Language Action Model with Unified Motion Vocabulary Zhirui Liu et al. · 构建统一运动词汇的大型语言动作模型，使人形机器人能遵循自由形式语言指令。聚焦人形机器人特定领域，虽有价值但通用 VLA 架构贡献有限，暂归值得了解。 CS.RO
You've Got a Golden Ticket: Improving Generative Robot Policies With A Single Noise Vector Omkar Patil et al. · 发现固定初始噪声向量可显著提升预训练生成式机器人策略的性能，无需重新采样。这是一个反直觉但极具工程价值的洞见，可立即应用于扩散策略推理优化。 CS.RO
Adaptive Action Chunking at Inference-time for Vision-Language-Action Models Yuanchang Liang et al. · 提出推理时自适应动作分块方法，平衡响应速度与执行连贯性。属于对现有 VLA 推理过程的工程改进，创新性一般，适合作为现有系统的补丁参考。 CS.RO
SIM1: Physics-Aligned Simulator as Zero-Shot Data Scaler in Deformable Worlds Yunsong Zhou et al. · 推出物理对齐的模拟器，作为可变形物体操作领域的零样本数据扩展器。主要针对仿真数据生成，缺乏真实机器人验证，属于相邻技术储备。 CS.RO

2026-04-14

VLA 研究日報VLA 研究日报

12 篇 5 篇共 17 篇

🔧 技術技术

Practical VLA 2026-04-14

V-CAGE: Vision-Closed-Loop Agentic Generation Engine for Robotic Manipulation

Yaru Liu et al. · 提出视觉闭环代理生成引擎，通过上下文感知的场景生成方法合成高保真训练数据以扩展 VLA 模型。为 VLA 研究者提供了新的数据合成与增强路径，本周可尝试复现数据生成流程。

cs.RO 閱讀原文

Practical VLA 2026-04-14

TouchAnything: Diffusion-Guided 3D Reconstruction from Sparse Robot Touches

Langzhe Gu et al. · 利用扩散模型引导稀疏触觉信号进行 3D 重建，解决遮挡下的几何估计难题。直接服务于触觉 VLA 方向，提供了一套从稀疏触感到完整几何的可用工具链。

cs.RO 閱讀原文

Practical VLA 2026-04-14

2D or 3D: Who Governs Salience in VLA Models? -- Tri-Stage Token Pruning Framework with Modality Salience Awareness

Zihao Zheng et al. · 提出三阶段 Token 剪枝框架，动态评估 2D/3D 模态显著性以优化 MVLA 模型效率。为多模态 VLA 部署提供了具体的推理加速方案，代码有望快速集成。

cs.RO 閱讀原文

Practical VLA 2026-04-14

Dejavu: Towards Experience Feedback Learning for Embodied Intelligence

Shaokai Wu et al. · 提出部署后经验反馈学习框架，使具身智能体能在真实环境中持续获取新知识并提升性能。解决了 VLA 模型部署后无法进化的痛点，具有明确的在线学习应用价值。

cs.RO 閱讀原文

Practical VLA 2026-04-14

You've Got a Golden Ticket: Improving Generative Robot Policies With A Single Noise Vector

Omkar Patil et al. · 发现固定初始噪声向量可显著提升预训练生成式机器人策略的性能，无需重新采样。这是一个反直觉但极具工程价值的洞见，可立即应用于扩散策略推理优化。

cs.RO 閱讀原文

📖 背景閱讀背景阅读

Background VLA 2026-04-14

AssemLM: Spatial Reasoning Multimodal Large Language Models for Robotic Assembly

Zhi Jing et al. · 针对机器人装配任务的空间推理多模态模型，旨在解决细粒度操作中的空间感知问题。摘要未提及具体架构创新或真实机器人实验验证，暂归为值得了解。

cs.RO 閱讀原文

Background VLA 2026-04-14

PhysInOne: Visual Physics Learning and Reasoning in One Suite

Siyuan Zhou et al. · 发布包含 200 万视频的大规模物理 grounding 合成数据集，旨在填补物理推理数据稀缺。属于重要数据资源，但非架构创新，适合长期关注而非紧急复用。

cs.RO 閱讀原文

Background VLA 2026-04-14

Dream to Fly: Model-Based Reinforcement Learning for Vision-Based Drone Flight

Angel Romero et al. · 基于模型的强化学习用于无人机竞速，主要聚焦飞行控制与感知规划。虽涉及具身智能，但偏向特定飞行器控制而非通用 VLA 操作架构，相关性中等。

cs.RO 閱讀原文

Background VLA 2026-04-14

RESample: A Robust Data Augmentation Framework via Exploratory Sampling for Robotic Manipulation

Yuquan Xue et al. · 通过探索性采样进行鲁棒数据增强的框架，旨在提升模仿学习效果。方法看似是对现有增强策略的组合优化，缺乏颠覆性创新，且摘要未展示显著 SOTA 超越。

cs.RO 閱讀原文

Background VLA 2026-04-14

Commanding Humanoid by Free-form Language: A Large Language Action Model with Unified Motion Vocabulary

Zhirui Liu et al. · 构建统一运动词汇的大型语言动作模型，使人形机器人能遵循自由形式语言指令。聚焦人形机器人特定领域，虽有价值但通用 VLA 架构贡献有限，暂归值得了解。

cs.RO 閱讀原文

Background VLA 2026-04-14

Adaptive Action Chunking at Inference-time for Vision-Language-Action Models

Yuanchang Liang et al. · 提出推理时自适应动作分块方法，平衡响应速度与执行连贯性。属于对现有 VLA 推理过程的工程改进，创新性一般，适合作为现有系统的补丁参考。

cs.RO 閱讀原文

Background VLA 2026-04-14

SIM1: Physics-Aligned Simulator as Zero-Shot Data Scaler in Deformable Worlds

Yunsong Zhou et al. · 推出物理对齐的模拟器，作为可变形物体操作领域的零样本数据扩展器。主要针对仿真数据生成，缺乏真实机器人验证，属于相邻技术储备。

cs.RO 閱讀原文

Background VLA 2026-04-14

AVA-VLA: Improving Vision-Language-Action models with Active Visual Attention

Lei Xiao et al. · 引入主动视觉注意力机制改进 VLA 模型，试图解决历史无关设计的局限。摘要未明确展示相比现有注意力机制的显著优势或独特实验结果，创新点略显常规。

cs.RO 閱讀原文

Background VLA [Unitree] 2026-04-14

Toward Hardware-Agnostic Quadrupedal World Models via Morphology Conditioning

Mohamad H. Danesh et al. · 通过形态条件化实现硬件无关的四足机器人世界模型，旨在提升泛化能力。虽涉及世界模型，但局限于四足 locomotion，与灵巧操作 VLA 距离较远。

cs.RO 閱讀原文

Background VLA 2026-04-14

Sim-to-Real Transfer for Muscle-Actuated Robots via Generalized Actuator Networks

Jan Schneider et al. · 利用广义执行器网络解决肌肉驱动机器人的虚实迁移问题。针对特定致动器类型的控制难题，属于底层控制与仿真迁移，非 VLA 高层架构核心。

cs.RO 閱讀原文

Background VLA 2026-04-14

WOMBET: World Model-based Experience Transfer for Robust and Sample-efficient Reinforcement Learning

Mintae Kim et al. · 提出基于世界模型的经验迁移框架，提升 RL 的鲁棒性与样本效率。方法较为通用，未明确展示在 VLA 复杂操作任务上的特异性突破，暂作了解。

cs.RO 閱讀原文

Background VLA 2026-04-14

Matrix-Game 3.0: Real-Time and Streaming Interactive World Model with Long-Horizon Memory

Zile Wang et al. · 推出具备长程记忆的实时流式交互式世界模型，主要用于视频生成与交互。虽名为世界模型，但侧重视频一致性而非机器人物理交互动力学，相关性弱。

cs.CV 閱讀原文

首頁首页 / VLA 日報VLA 日报 / 2026-04-14