雙週報告 2026-03-25 — PULSAR

🤔

双周反思 | 2026-03-12 – 2026-03-25

读完没立场 = 这两周在消费而不在研究

///

1️⃣

language_grounding 14 天加速比 2.53x 但 7 天骤降至 0.46x，35 篇产出中无新⚡论文——这是典型的「红利吃完」曲线。你认为这个方向是暂时休整还是结构性见顶？给出你的判断依据，不允许说「看情况」。

2️⃣

flow_matching 与 diffusion_policy 产出持平（各 24 篇），但 flow_matching 加速比 0.89x > diffusion 0.70x，且是唯一 momentum stable 的方法族。如果只能选一个方向投入，你选哪个？理由必须包含对「工程选择 vs 理论胜利」的立场。

3️⃣

tactile 加速比 0.26x（全场倒数第二），7 天仅 5 篇论文，被 dexterous_hand（21 篇，0.62x）以 4:1 碾压——但本期唯一⚡触觉论文 OmniVTA 走的是「视触融合世界模型」路线。触觉方向若想存活，必须放弃独立任务定位吗？你的组会怎么选？

4️⃣

40 次 SOTA 变动中 RoboChallenge 仅 2 次（5%），是唯一未饱和基准；CALVIN/LIBERO 承包 75% 更新但已全线饱和（99%+）。继续刷饱和基准是「稳妥毕业策略」还是「学术自杀」？给出你的时间线判断：最晚何时必须迁移？

5️⃣

产业端：Tesla Optimus Gen 3 确认 2026 年底量产、Ubtech 签署 10,000 台产能协议、深圳租赁价格降至数百元/天；学术端：tactile(0.26x)、sim_to_real(0.31x)、cross_embodiment(0.26x) 全线衰退。这个温差是「机会窗口」还是「危险信号」？你的团队该如何响应？

///

🔬

本期 3 篇⚡论文（OmniVTA、VP-VLA、Fast-WAM）分别涉及视触世界模型、视觉提示接口、世界模型测试时想象。你能说清 flow matching 跟 diffusion policy 的本质区别吗？如果不能，这是你这两周最该补的课——推荐阅读 π-StepNFT (arXiv:2603.02083) 的 Section 3。

🔬

rl_finetuning (51 篇，0.52x) 对 instruction_tuning (4 篇，0.05x) 形成近 13:1 的压倒性优势——报告说是「经济模型问题」而非技术优劣。你同意吗？请列出至少 2 个可证伪的判断标准，用来验证这个假设。

🔬

上期预测回顾：2026-02-25 预测「Q2 将出现首个开源触觉 VLA 基准」和「世界模型+VLA 在 sim-to-real 转移率上超越纯 VLA」。本期 OmniVTA 发布 21K+ 轨迹视触数据集但未开放基准，world_model 趋势 declining (0.75x 但 momentum cooling)。基于当前数据，你的判断是 ✅ 已验证 / ❌ 落空 / ⏳ 待观察？必须选一个，并给出理由。