Skip to content
VLA 線 · 查看同日 AI 報告 →查看同日 AI 报告 →
VLA 研究日報 Pulsar
LIVE
— AI 線今日無資料 —— AI 线今日无资料 —

VLA 研究日報VLA 研究日报

共 39 篇

🔧 技術技术

VLA

Gated Memory Policy

Yihuai Gao et al. · 提出门控记忆策略以自适应处理马尔可夫与非马尔可夫任务。简单有效的架构改进,解决历史信息利用难题,易于集成到现有 VLA 中。

📖 背景閱讀背景阅读

VLA [Washington University in St. Louis]

Rodrigues Network for Learning Robot Actions

Jialiang Zhang et al. · 引入 Rodrigues 网络以体现关节运动学的归纳偏置。属于底层动作表示优化,虽有益但非 VLA 核心架构突破,对整体范式影响有限。

VLA [Stanford]

FASTER: Value-Guided Sampling for Fast RL

Perry Dong et al. · 提出值引导采样加速 RL 测试时缩放。虽提及 RL,但未明确与 VLA 预训练/微调的结合点,更偏向通用 RL 加速,与 VLA 核心距离稍远。