VLA-OPD: Bridging Offline SFT and Online RL for Vision-Language-Action Models via On-Policy Distillation
Zhide Zhong et al. · VLA 后训练范式(SFT+RL 桥接),有明确部署应用路径
Zhide Zhong et al. · VLA 后训练范式(SFT+RL 桥接),有明确部署应用路径
Chen Yang et al. · VLA 部署效率优化 V2,解决真实部署速度问题
Jiayi Chen et al. · VLA 动作解码改进(离散流匹配),有实质架构贡献
Quan Dao et al. · 通用扩散架构改进,无明确 VLA 应用路径
Isaac Han et al. · 触觉感知但聚焦人体姿态估计,非机器人操作 VLA
John Bateman et al. · 传统模仿学习方法,无 VLA 架构关联
Yuxuan Li et al. · 安全基准但侧重数字代理,物理机器人实验不明确
Xinhao Liu et al. · 具身导航仿真平台,填补仿真底座方向但非 VLA 算法
Haichao Zhang et al. · 轨迹预测任务,VLA 相邻但非控制策略
Jiange Yang et al. · 视频潜运动学习用于机器人,无明确 VLA 架构
Zhuoran Li et al. · VLA 鲁棒性方法,标题宏大但贡献细节不足 [💧灌水]
Xinqi et al. · 开源灵巧手硬件,重要资源但非 VLA 算法
Haoyang Luo et al. · 高频数据手套硬件,传感设备非 VLA 方法
Iana Zhura et al. · 扩散策略用于导航 + 预抓取,VLA 相邻但架构创新一般
Amirhosein Chahe et al. · 语言条件导航,世界模型 + 策略但非操作 VLA
Yiyuan Pan et al. · 长视野任务神经符号方法,VLA 相邻但无明确架构
Yiru Wang et al. · VLA 效率方法但聚焦自动驾驶,按标准降级