Skip to content
VLA 線 · 查看同日 AI 報告 →查看同日 AI 报告 →
VLA 研究日報 Pulsar
LIVE
— AI 線今日無資料 —— AI 线今日无资料 —

VLA 研究日報VLA 研究日报

共 28 篇

🔧 技術技术

📖 背景閱讀背景阅读

VLA [Shenzhen Technology University]

Reflection-Based Task Adaptation for Self-Improving VLA

Baicheng Li et al. · 利用反思机制实现 VLA 模型的在线自我改进与任务适应,试图替代部分 RL 微调过程。概念具有吸引力,但需确认在真实机器人上的迭代效率与稳定性提升。

VLA

Discrete Flow Matching Policy Optimization

Maojiang Su et al. · 提出离散流匹配策略优化框架 DoMinO,用于 RL 微调离散流模型。方法论创新,但摘要未明确展示在机器人操作任务上的实验验证,偏向通用强化学习。