VLA
LAMP: Lift Image-Editing as General 3D Priors for Open-world Manipulation
提出利用图像编辑模型作为 3D 先验以增强开放世界操作泛化性。摘要截断导致缺乏具体架构细节与实验验证,暂归为值得了解的方向性探索。
hf-papers
閱讀原文
提出利用图像编辑模型作为 3D 先验以增强开放世界操作泛化性。摘要截断导致缺乏具体架构细节与实验验证,暂归为值得了解的方向性探索。
结合生成式世界模型与 VLM 进行导航轨迹预测,侧重具身导航而非直接的操作控制(VLA 核心)。方法相邻但非本周可复用的操作策略。