VLA 線 · 查看同日 AI 報告 →查看同日 AI 报告 →

2026-04-23

VLA 研究日報 Pulsar

LIVE

— AI 線今日無資料 —— AI 线今日无资料 —

VLA 線VLA 线 · cs.RO · cs.AI · cs.LG

FASTER: Value-Guided Sampling for Fast RL 提出一种基于价值引导的采样方法以加速强化学习推理，减少测试时计算成本。虽与策略优化相关，但缺乏针对 VLA 架构或机器人操作的具体实验验证。 HF-PAPER
Gated Memory Policy Yihuai Gao et al. · 引入门控记忆机制处理非马尔可夫任务，通过动态调整历史窗口长度平衡计算效率与信息保留。该方法可直接集成至现有 VLA 模型中以提升长序列处理能力。 CS.RO
RoboWM-Bench: A Benchmark for Evaluating World Models in Robotic Manipulation Feng Jiang et al. · 发布首个专门评估机器人操作中世界模型物理合理性的基准数据集。填补了当前仅关注视觉逼真度而忽视物理一致性的评估空白，对世界模型研究具有重要参考价值。 CS.RO
Wrench-Aware Admittance Control for Unknown-Payload Manipulation Hossein Gholampour et al. · 针对未知负载提出力矩感知导纳控制算法，解决质心偏移导致的操控不稳问题。属于传统控制领域改进，未涉及 VLA 或数据驱动策略，与核心研究方向关联较弱。 CS.RO
VLA Foundry: A Unified Framework for Training Vision-Language-Action Models Jean Mercat et al. · 开源统一框架 VLA Foundry，整合 LLM、VLM 和 VLA 训练流程，解决现有工具链碎片化问题。提供标准化接口和预置模块，显著降低 VLA 复现门槛，本周即可用于工程实践。 CS.RO
UniT: Toward a Unified Physical Language for Human-to-Humanoid Policy Learning and World Modeling Boyu Chen et al. · 探索利用人类第一视角数据通过统一物理语言桥接人形机器人策略学习。旨在解决机器人数据稀缺问题，但摘要未展示具体跨形态迁移实验结果，需进一步验证有效性。 CS.RO
PhysMem: Scaling Test-time Physical Memory for Robot Manipulation Haoyang Li et al. · 提出 PhysMem 机制，在测试时动态扩展物理属性记忆以增强 VLM 规划器对摩擦、稳定性等物理特性的预测能力。直接针对 VLA 物理常识缺失痛点，方法具明确应用路径。 CS.RO
ExpertGen: Scalable Sim-to-Real Expert Policy Learning from Imperfect Behavior Priors Zifan Xu et al. · 利用不完美的行为先验生成大规模仿真专家数据，进而实现 Sim-to-Real 策略迁移。虽涉及数据生成，但重点在于 RL 数据扩充而非 VLA 架构创新，且缺乏真实机器人 VLA 对比。 CS.RO
ARM: Advantage Reward Modeling for Long-Horizon Manipulation Yiming Mao et al. · 提出优势奖励建模（ARM）以解决长程操作中的稀疏奖励信用分配问题。属于 RL 奖励设计改进，未明确结合 VLA 的多模态特性或在标准 VLA 基准上进行评估。 CS.RO
Drift-Based Policy Optimization: Native One-Step Policy Learning for Online Robot Control Yuxuan Gao et al. · 提出基于漂移的策略优化方法，实现单步原生策略学习，避免扩散策略的多步去噪延迟。显著提升在线控制速度，为 VLA 实时部署提供高效替代方案，具高复用价值。 CS.RO
HELM: Harness-Enhanced Long-horizon Memory for Vision-Language-Action Manipulation Zijian Zeng et al. · 针对 VLA 长程任务失败问题，提出 HELM 机制通过 harness 结构增强长期记忆保持。直接在 LIBERO 等基准上验证，解决了上下文扩展无效的瓶颈，属实质性架构改进。 CS.AI
LAMP: Lift Image-Editing as General 3D Priors for Open-world Manipulation Jingjing Wang et al. · 利用图像编辑技术提取通用 3D 先验知识以辅助开放世界操作。方法新颖但主要依赖仿真或间接验证，缺乏在标准 VLA 基准上的端到端性能对比，暂归为值得了解。 CS.CV

2026-04-23

VLA 研究日報VLA 研究日报

14 篇 6 篇共 20 篇

🔧 技術技术

Practical VLA 2026-04-23

Gated Memory Policy

Yihuai Gao et al. · 引入门控记忆机制处理非马尔可夫任务，通过动态调整历史窗口长度平衡计算效率与信息保留。该方法可直接集成至现有 VLA 模型中以提升长序列处理能力。

cs.RO 閱讀原文

Practical VLA 2026-04-23

VLA Foundry: A Unified Framework for Training Vision-Language-Action Models

Jean Mercat et al. · 开源统一框架 VLA Foundry，整合 LLM、VLM 和 VLA 训练流程，解决现有工具链碎片化问题。提供标准化接口和预置模块，显著降低 VLA 复现门槛，本周即可用于工程实践。

cs.RO 閱讀原文

Practical VLA 2026-04-23

PhysMem: Scaling Test-time Physical Memory for Robot Manipulation

Haoyang Li et al. · 提出 PhysMem 机制，在测试时动态扩展物理属性记忆以增强 VLM 规划器对摩擦、稳定性等物理特性的预测能力。直接针对 VLA 物理常识缺失痛点，方法具明确应用路径。

cs.RO 閱讀原文

Practical VLA 2026-04-23

Drift-Based Policy Optimization: Native One-Step Policy Learning for Online Robot Control

Yuxuan Gao et al. · 提出基于漂移的策略优化方法，实现单步原生策略学习，避免扩散策略的多步去噪延迟。显著提升在线控制速度，为 VLA 实时部署提供高效替代方案，具高复用价值。

cs.RO 閱讀原文

Practical VLA 2026-04-23

HELM: Harness-Enhanced Long-horizon Memory for Vision-Language-Action Manipulation

Zijian Zeng et al. · 针对 VLA 长程任务失败问题，提出 HELM 机制通过 harness 结构增强长期记忆保持。直接在 LIBERO 等基准上验证，解决了上下文扩展无效的瓶颈，属实质性架构改进。

cs.AI 閱讀原文

Practical VLA 2026-04-23

Mask World Model: Predicting What Matters for Robust Robot Policy Learning

Yunfan Lou et al. · 提出掩码世界模型，聚焦关键物理特征预测而非全像素重建，以提升策略鲁棒性。解决视频世界模型过拟合视觉细节的问题，可直接用于增强 VLA 的世界模型组件。

cs.RO 閱讀原文

📖 背景閱讀背景阅读

Background VLA 2026-04-23

FASTER: Value-Guided Sampling for Fast RL

提出一种基于价值引导的采样方法以加速强化学习推理，减少测试时计算成本。虽与策略优化相关，但缺乏针对 VLA 架构或机器人操作的具体实验验证。

hf-papers 閱讀原文

Background VLA 2026-04-23

RoboWM-Bench: A Benchmark for Evaluating World Models in Robotic Manipulation

Feng Jiang et al. · 发布首个专门评估机器人操作中世界模型物理合理性的基准数据集。填补了当前仅关注视觉逼真度而忽视物理一致性的评估空白，对世界模型研究具有重要参考价值。

cs.RO 閱讀原文

Background VLA 2026-04-23

Wrench-Aware Admittance Control for Unknown-Payload Manipulation

Hossein Gholampour et al. · 针对未知负载提出力矩感知导纳控制算法，解决质心偏移导致的操控不稳问题。属于传统控制领域改进，未涉及 VLA 或数据驱动策略，与核心研究方向关联较弱。

cs.RO 閱讀原文

Background VLA 2026-04-23

UniT: Toward a Unified Physical Language for Human-to-Humanoid Policy Learning and World Modeling

Boyu Chen et al. · 探索利用人类第一视角数据通过统一物理语言桥接人形机器人策略学习。旨在解决机器人数据稀缺问题，但摘要未展示具体跨形态迁移实验结果，需进一步验证有效性。

cs.RO 閱讀原文

Background VLA 2026-04-23

ExpertGen: Scalable Sim-to-Real Expert Policy Learning from Imperfect Behavior Priors

Zifan Xu et al. · 利用不完美的行为先验生成大规模仿真专家数据，进而实现 Sim-to-Real 策略迁移。虽涉及数据生成，但重点在于 RL 数据扩充而非 VLA 架构创新，且缺乏真实机器人 VLA 对比。

cs.RO 閱讀原文

Background VLA 2026-04-23

ARM: Advantage Reward Modeling for Long-Horizon Manipulation

Yiming Mao et al. · 提出优势奖励建模（ARM）以解决长程操作中的稀疏奖励信用分配问题。属于 RL 奖励设计改进，未明确结合 VLA 的多模态特性或在标准 VLA 基准上进行评估。

cs.RO 閱讀原文

Background VLA 2026-04-23

LAMP: Lift Image-Editing as General 3D Priors for Open-world Manipulation

Jingjing Wang et al. · 利用图像编辑技术提取通用 3D 先验知识以辅助开放世界操作。方法新颖但主要依赖仿真或间接验证，缺乏在标准 VLA 基准上的端到端性能对比，暂归为值得了解。

cs.CV 閱讀原文

Background VLA 2026-04-23

MultiWorld: Scalable Multi-Agent Multi-View Video World Models

Haoyu Wu et al. · 构建可扩展的多智能体多视角视频世界模型，模拟环境动态。虽与 embodied AI 相关，但侧重于视频生成与多智能体交互，未直接涉及 VLA 策略学习或操作任务。

cs.CV 閱讀原文

Background VLA 2026-04-23

Closed-loop tactile-visual interactivity via chip-free luminescent fibers enabled by capacitive coupling

Xun-En Wu et al. · 发表新型无芯片发光光纤触觉传感器，实现闭环触觉-视觉交互。属于硬件传感创新，虽对触觉 VLA 有潜在价值，但非算法或模型层面的进展，归为值得了解。

Science-Advances 閱讀原文

Background VLA 2026-04-23

A time-stamping tactile sensor enabled by pseudoconductive interface design at dielectric heterojunctions

Byungseok Seo et al. · 介绍基于介电异质结伪导电界面设计的带时间戳触觉传感器。纯硬件传感技术论文，不涉及 VLA 算法、训练或推理，与核心研究方向无直接关联。

Science-Advances 閱讀原文

Background VLA 2026-04-23

Flow-Opt: Scalable Centralized Multi-Robot Trajectory Optimization with Flow Matching and Differentiable Optimization

Simon Idoko et al. · 结合流匹配与微分优化解决多机器人集中式轨迹规划问题。属于运动规划与控制领域，未涉及视觉语言理解或 VLA 决策层，与 VLA 核心架构无关。

cs.RO 閱讀原文

Background VLA 2026-04-23

Curiosity-Critic: Cumulative Prediction Error Improvement as a Tractable Intrinsic Reward for World Model Training

Vin Bhaskara et al. · 提出基于累积预测误差改进的好奇心奖励机制，用于世界模型训练。属于自监督学习奖励设计，虽可用于预训练，但未直接结合 VLA 操作任务进行验证。

cs.AI 閱讀原文

Background VLA 2026-04-23

Safety-Critical Contextual Control via Online Riemannian Optimization with World Models

Tongxin Li · 利用黎曼优化和世界模型实现安全关键的上下文控制。侧重控制理论与安全性保证，未涉及 VLA 的多模态语义理解或通用策略学习，相关性较低。

cs.AI 閱讀原文

Background VLA 2026-04-23

Cloning Deterministic Worlds: The Critical Role of Latent Geometry in Long-Horizon World Models

Zaishuo Xia et al. · 分析潜空间几何结构对长程世界模型克隆确定性世界的重要性。理论分析为主，探讨世界模型内在机理，对 VLA 研究者有启发，但非直接的方法论贡献。

cs.AI 閱讀原文

首頁首页 / VLA 日報VLA 日报 / 2026-04-23