双周反思 | 2026-03-12 – 2026-03-25
读完没立场 = 这两周在消费而不在研究
language_grounding 14 天加速比 2.53x 但 7 天骤降至 0.46x,35 篇产出中无新⚡论文——这是典型的「红利吃完」曲线。你认为这个方向是暂时休整还是结构性见顶?给出你的判断依据,不允许说「看情况」。
flow_matching 与 diffusion_policy 产出持平(各 24 篇),但 flow_matching 加速比 0.89x > diffusion 0.70x,且是唯一 momentum stable 的方法族。如果只能选一个方向投入,你选哪个?理由必须包含对「工程选择 vs 理论胜利」的立场。
tactile 加速比 0.26x(全场倒数第二),7 天仅 5 篇论文,被 dexterous_hand(21 篇,0.62x)以 4:1 碾压——但本期唯一⚡触觉论文 OmniVTA 走的是「视触融合世界模型」路线。触觉方向若想存活,必须放弃独立任务定位吗?你的组会怎么选?
40 次 SOTA 变动中 RoboChallenge 仅 2 次(5%),是唯一未饱和基准;CALVIN/LIBERO 承包 75% 更新但已全线饱和(99%+)。继续刷饱和基准是「稳妥毕业策略」还是「学术自杀」?给出你的时间线判断:最晚何时必须迁移?
产业端:Tesla Optimus Gen 3 确认 2026 年底量产、Ubtech 签署 10,000 台产能协议、深圳租赁价格降至数百元/天;学术端:tactile(0.26x)、sim_to_real(0.31x)、cross_embodiment(0.26x) 全线衰退。这个温差是「机会窗口」还是「危险信号」?你的团队该如何响应?
本期 3 篇⚡论文(OmniVTA、VP-VLA、Fast-WAM)分别涉及视触世界模型、视觉提示接口、世界模型测试时想象。你能说清 flow matching 跟 diffusion policy 的本质区别吗?如果不能,这是你这两周最该补的课——推荐阅读 π-StepNFT (arXiv:2603.02083) 的 Section 3。
rl_finetuning (51 篇,0.52x) 对 instruction_tuning (4 篇,0.05x) 形成近 13:1 的压倒性优势——报告说是「经济模型问题」而非技术优劣。你同意吗?请列出至少 2 个可证伪的判断标准,用来验证这个假设。
上期预测回顾:2026-02-25 预测「Q2 将出现首个开源触觉 VLA 基准」和「世界模型+VLA 在 sim-to-real 转移率上超越纯 VLA」。本期 OmniVTA 发布 21K+ 轨迹视触数据集但未开放基准,world_model 趋势 declining (0.75x 但 momentum cooling)。基于当前数据,你的判断是 ✅ 已验证 / ❌ 落空 / ⏳ 待观察?必须选一个,并给出理由。