Learning Structured Robot Policies from Vision-Language Models via Synthetic Neuro-Symbolic Supervision
Alessandro Adami et al. · 通过神经符号监督从 VLM 学习结构化机器人策略,解决端到端策略不可解释问题,提供可复用的符号监督框架。
Alessandro Adami et al. · 通过神经符号监督从 VLM 学习结构化机器人策略,解决端到端策略不可解释问题,提供可复用的符号监督框架。
Zihua Wang et al. · 提出推测验证机制降低 VLA 推理成本,开环规划 + 闭环验证架构可直接集成到现有 VLA 系统。
Peiyan Li et al. · 多视角视频扩散策略引入 3D 时空感知,改进现有 Diffusion Policy 的空间理解能力,代码可复用。
Haoyu Wei et al. · 提出流匹配异步策略解决机器人操作延迟问题,但摘要截断无法判断具体创新点和实验验证。
Antonia Bronars et al. · 研究控制器增益对策略学习的影响,属于底层控制调参而非 VLA 架构创新,MIT 团队工作。
Yiming Mao et al. · 优势奖励建模解决长程操作稀疏奖励问题,属于 RL 奖励设计而非 VLA 核心架构。
Takuya Shiba · 分析离散动作 tokenization 对 VLA 扩展的限制,重要理论洞察但未提出解决方案。
Jiashu Yang et al. · 主动视觉感知系统决定观察位置和尺度,属于具身感知相邻方向而非 VLA 核心。
Yunfeng Lin et al. · 标准化机器人部署中间件框架,标题夸大但实质是工程接口统一,无 VLA 算法创新 [💧灌水]。
Yanjia Huang et al. · 折纸任务的世界模型规划,特定任务验证而非通用 VLA 方法,仿真为主。
Ming Li et al. · 服装 3D 重建用于 sim-to-real,属于感知重建相邻方向,非 VLA 策略学习核心。
Hang Yang et al. · 软体机器人逆动力学流匹配框架,特定机器人类型控制而非通用 VLA 架构。
Liudi Yang et al. · 软体机器人抓取流匹配学习,特定硬件平台方法,泛化性有限。
Yan Zheng et al. · 3D 世界模型代码生成基准,评测工具而非 VLA 方法,重要但不紧急。
Wancong Zhang et al. · 潜在世界模型分层规划用于具身控制,MPC+ 世界模型相邻方向,非 VLA 架构创新。