VLA [NVIDIA]
Fast-ThinkAct: Efficient Vision-Language-Action Reasoning via Verbalizable Latent Planning
提出高效VLA推理方法,通过可语言化的潜在规划实现
cs.RO
閱讀原文
提出高效VLA推理方法,通过可语言化的潜在规划实现
提出零样本灵巧工具操作策略,具有实际应用潜力
提出开放词汇视觉loco-manipulation的人形末端执行器控制方法
通过触觉引导在推理时调整视觉运动策略,解决细粒度操作问题
提出演示和语言指导的透明物体操作方法,填补领域空白
提出统一的VLA模型,用于具身多模态链式思维推理
提出增强记忆依赖操作任务的VLA方法,具有实际应用潜力
几何感知的持续适应方法,解决跨任务sim-to-real迁移问题
提出交互引导的RL框架,适用于长时序机器人操作
提出深度感知的RGB潜在动作学习方法,提升VLA模型性能
提出双记忆增强的VLA模型,提高机器人操作效率
跨模态小样本适应,无明确VLA应用路径
研究VLA模型对多模态扰动的鲁棒性,但无具体创新点
BEV语义分割,与VLA相关性较弱
基于模型的强化学习性能不对称性研究,与VLA关联不大
参数化运动生成器,与VLA直接相关性较弱
机器人扩散规划流匹配,但实验设计较弱
人-外骨骼运动学校准,与VLA直接相关性较弱
基于尖峰视觉的乒乓球机器人系统,与VLA直接相关性较弱
快速视觉强化学习,但实验设计较弱
使用LLM进行机器人积木堆叠,但缺乏深度分析
多智能体合作竞争游戏,与VLA直接相关性较弱
动态环境下的灵巧抓取,但实验设计较弱
端到端自动驾驶,但与VLA直接相关性较弱
递归信念VLA模型,但摘要无具体技术路线
多视图VLA模型的最佳特征感知令牌剪枝,但贡献一般