VLA 線 · 查看同日 AI 報告 →查看同日 AI 报告 →

2026-03-04

VLA 研究日報 Pulsar

LIVE

— AI 線今日無資料 —— AI 线今日无资料 —

VLA 線VLA 线 · cs.RO · cs.AI · cs.LG

Robometer: Scaling General-Purpose Robotic Reward Models via Trajectory Comparisons [Stanford] 通用机器人奖励模型缩放方法。通过轨迹比较训练。适用于 VLA RLHF 微调，但非 VLA 架构核心。 CS.RO
ACDC: Adaptive Curriculum Planning with Dynamic Contrastive Control for Goal-Conditioned Reinforcement Learning in Robotic Manipulation [Unknown] 目标条件 RL 的课程规划方法。动态对比控制。属于标准 RL 改进，无 VLA 架构创新。 CS.RO
$\pi$-StepNFT: Wider Space Needs Finer Steps in Online RL for Flow-based VLAs [Xidian] 提出流匹配 VLA 在线 RL 自适应步长方法。解决宽动作空间不稳定问题。显著提升 RL 微调效率，代码可用。 CS.RO
CHOP: Counterfactual Human Preference Labels Improve Obstacle Avoidance in Visuomotor Navigation Policies [CMU] 反事实偏好标签用于避障。导航策略特定优化。与通用 VLA 操作任务关联度较低。 CS.RO
Closed-Loop Action Chunks with Dynamic Corrections for Training-Free Diffusion Policy [中科院] 无需训练的扩散策略动态校正方法。推理阶段修正动作块。立即提升鲁棒性，工程落地价值高，本周可集成。 CS.RO
Neural Implicit Action Fields: From Discrete Waypoints to Continuous Functions for Vision-Language-Action Models [中科院] 神经隐式动作场表示。离散转连续函数。表示学习改进，缺乏基准 SOTA 验证。 CS.RO
TacMamba: A Tactile History Compression Adapter Bridging Fast Reflexes and Slow VLA Reasoning [清华] 利用 Mamba 压缩触觉历史适配 VLA。桥接快速反射与慢速推理。高效触觉融合方案，支持灵巧操作任务。 CS.RO
KERV: Kinematic-Rectified Speculative Decoding for Embodied VLA Models [上交] 运动学修正的推测解码。加速 VLA 推理。效率优化方法，但单步生成更具颠覆性。 CS.RO
ROSER: Few-Shot Robotic Sequence Retrieval for Scalable Robot Learning [CMU] 少shot 机器人序列检索。可扩展学习。检索增强标准应用，无新 VLA 范式。 CS.RO
Mean-Flow based One-Step Vision-Language-Action [中科院] 基于均值流的单步 VLA 生成方法。大幅降低推理延迟。兼容现有流模型，即插即用提升部署速度。 CS.RO
Non-Markovian Long-Horizon Robot Manipulation via Keyframe Chaining [Unknown] 关键帧链式长程操作。非马尔可夫规划。分层规划常见方法，增量改进。 CS.RO
Jailbreaking Embodied LLMs via Action-level Manipulation [Unknown] 具身 LLM 越狱攻击分析。动作级操纵。安全对齐分析，非架构推进。 CS.RO

2026-03-04

VLA 研究日報VLA 研究日报

19 篇 5 篇共 24 篇

🔧 技術技术

Practical VLA [Xidian] 2026-03-04

$\pi$-StepNFT: Wider Space Needs Finer Steps in Online RL for Flow-based VLAs

提出流匹配 VLA 在线 RL 自适应步长方法。解决宽动作空间不稳定问题。显著提升 RL 微调效率，代码可用。

cs.RO 閱讀原文

Practical VLA [中科院] 2026-03-04

Closed-Loop Action Chunks with Dynamic Corrections for Training-Free Diffusion Policy

无需训练的扩散策略动态校正方法。推理阶段修正动作块。立即提升鲁棒性，工程落地价值高，本周可集成。

cs.RO 閱讀原文

Practical VLA [清华] 2026-03-04

TacMamba: A Tactile History Compression Adapter Bridging Fast Reflexes and Slow VLA Reasoning

利用 Mamba 压缩触觉历史适配 VLA。桥接快速反射与慢速推理。高效触觉融合方案，支持灵巧操作任务。

cs.RO 閱讀原文

Practical VLA [中科院] 2026-03-04

Mean-Flow based One-Step Vision-Language-Action

基于均值流的单步 VLA 生成方法。大幅降低推理延迟。兼容现有流模型，即插即用提升部署速度。

cs.RO 閱讀原文

Practical VLA [科大] 2026-03-04

LangGap: Diagnosing and Closing the Language Gap in Vision-Language-Action Models

诊断并修复 VLA 语言对齐缺陷。提升指令跟随准确率。解决语言泛化瓶颈，提供对齐工具包。

cs.RO 閱讀原文

📖 背景閱讀背景阅读

Background VLA [Stanford] 2026-03-04

Robometer: Scaling General-Purpose Robotic Reward Models via Trajectory Comparisons

通用机器人奖励模型缩放方法。通过轨迹比较训练。适用于 VLA RLHF 微调，但非 VLA 架构核心。

cs.RO 閱讀原文

Background VLA [Unknown] 2026-03-04

ACDC: Adaptive Curriculum Planning with Dynamic Contrastive Control for Goal-Conditioned Reinforcement Learning in Robotic Manipulation

目标条件 RL 的课程规划方法。动态对比控制。属于标准 RL 改进，无 VLA 架构创新。

cs.RO 閱讀原文

Background VLA [CMU] 2026-03-04

CHOP: Counterfactual Human Preference Labels Improve Obstacle Avoidance in Visuomotor Navigation Policies

反事实偏好标签用于避障。导航策略特定优化。与通用 VLA 操作任务关联度较低。

cs.RO 閱讀原文

Background VLA [中科院] 2026-03-04

Neural Implicit Action Fields: From Discrete Waypoints to Continuous Functions for Vision-Language-Action Models

神经隐式动作场表示。离散转连续函数。表示学习改进，缺乏基准 SOTA 验证。

cs.RO 閱讀原文

Background VLA [上交] 2026-03-04

KERV: Kinematic-Rectified Speculative Decoding for Embodied VLA Models

运动学修正的推测解码。加速 VLA 推理。效率优化方法，但单步生成更具颠覆性。

cs.RO 閱讀原文

Background VLA [CMU] 2026-03-04

ROSER: Few-Shot Robotic Sequence Retrieval for Scalable Robot Learning

少shot 机器人序列检索。可扩展学习。检索增强标准应用，无新 VLA 范式。

cs.RO 閱讀原文

Background VLA [Unknown] 2026-03-04

Non-Markovian Long-Horizon Robot Manipulation via Keyframe Chaining

关键帧链式长程操作。非马尔可夫规划。分层规划常见方法，增量改进。

cs.RO 閱讀原文

Background VLA [Unknown] 2026-03-04

Jailbreaking Embodied LLMs via Action-level Manipulation

具身 LLM 越狱攻击分析。动作级操纵。安全对齐分析，非架构推进。

cs.RO 閱讀原文

Background VLA [Unknown] 2026-03-04

Hybrid TD3: Overestimation Bias Analysis and Stable Policy Optimization for Hybrid Action Space

混合动作空间 TD3 改进。过估计偏差分析。通用 RL 算法，非 VLA 特定。

cs.RO 閱讀原文

Background VLA [清华] 2026-03-04

RMBench: Memory-Dependent Robotic Manipulation Benchmark with Insights into Policy Design

记忆依赖操作基准。策略设计洞察。基准评测论文，重要但不紧急。

cs.RO 閱讀原文

Background VLA [Stanford] 2026-03-04

D-REX: Differentiable Real-to-Sim-to-Real Engine for Learning Dexterous Grasping

可微分实 - 仿 - 实引擎。灵巧抓取学习。仿真工具链，非 VLA 模型。

cs.RO 閱讀原文

Background VLA [Unknown] 2026-03-04

DAM-VLA: A Dynamic Action Model-Based Vision-Language-Action Framework for Robot Manipulation

动态动作模型 VLA 框架。摘要缺乏具体技术路线。疑似已有方法简单组合，无实质创新。 [💧灌水]

cs.RO 閱讀原文

Background VLA [Columbia] 2026-03-04

Minimalist Compliance Control

极简柔顺控制。安全物理交互。底层控制策略，非 VLA 策略。

cs.RO 閱讀原文

Background VLA [Unknown] 2026-03-04

UniHM: Unified Dexterous Hand Manipulation with Vision Language Model

统一灵巧手操作 VLM。物理可行规划。VLM 应用，无新架构。

cs.RO 閱讀原文

Background VLA [清华] 2026-03-04

TGM-VLA: Task-Guided Mixup for Sampling-Efficient and Robust Robotic Manipulation

任务引导 Mixup 数据增强。采样效率提升。将标准 Mixup 增强迁移至 VLA。无差异化创新。属于机械移植模式，预期收益微小。 [💧灌水]

cs.RO 閱讀原文

Background VLA [Unknown] 2026-03-04

Zero-Shot Robotic Manipulation via 3D Gaussian Splatting-Enhanced Multimodal Retrieval-Augmented Generation

3DGS 增强 RAG 零shot 操作。组合 3DGS 和 RAG buzzwords 用于机器人操作。无新 VLA 架构贡献。典型移植论文，缺乏深度分析。 [💧灌水]

cs.RO 閱讀原文

Background VLA [Meta] 2026-03-04

HydroShear: Hydroelastic Shear Simulation for Tactile Sim-to-Real Reinforcement Learning

水弹性剪切触觉仿真。触觉 Sim2Real。仿真工具，非模型架构。

cs.RO 閱讀原文

Background VLA [MERL] 2026-03-04

Embedding Morphology into Transformers for Cross-Robot Policy Learning

形态嵌入 Transformer。跨机器人策略。跨具身泛化方向，但方法较标准。

cs.RO 閱讀原文

Background VLA [Unknown] 2026-03-04

Learning Physics from Pretrained Video Models: A Multimodal Continuous and Sequential World Interaction Models for Robotic Manipulation

从预训练视频模型学物理。世界交互模型。世界模型方向，增量工作。

cs.RO 閱讀原文

首頁首页 / VLA 日報VLA 日报 / 2026-03-04