Skip to content
CLASSIFIED · RESEARCH INTELLIGENCE | 週報 + 雙週 · WEEKLY + BIWEEKLY

情報報告情报报告

PULSAR INTELLIGENCE ARCHIVE  ·  週報偵察 + 雙週深度分析


週報(RECON)每週自動生成,聚焦意外信號、可證偽命題與觀察清單——前瞻偵察下週動態。雙週報(INTEL)深度回顧兩週研究進展,涵蓋預測驗證(✅ / ❌ / ⏳)、假設校準與反思修正。兩者交替覆蓋 VLA 和 AI 應用雙線。周报(RECON)每周自动生成,聚焦意外信号、可证伪命题与观察清单——前瞻侦察下周动态。双周报(INTEL)深度回顾两周研究进展,涵盖预测验证(✅ / ❌ / ⏳)、假设校准与反思修正。两者交替覆盖 VLA 和 AI 应用双线。

22 DISPATCHES
10 7D RECON
12 14D INTEL
VLA 雙週報告双周报告 2026.04.09 – 04.22

VLA 深度分析 · 2026年4月22日

🤔 双周反思 | 2026-04-09 – 2026-04-22 读完没立场 = 这两周在消费而不在研究 ━━━ 趋势与判断 ━━━ 1️⃣ 连续 15 天社交情报无顶级实验室信号,同期产业端千寻 30 天 30 亿融资、智元 GO-2 发布、特斯拉 Optimus 上海量产线确认、逐际动力开源 FluxVLA Engine。学术界 12 个方法族全面减速,仅 multitask 在加速(1.28x),57.2% 的论文是增量变体。你认为这是"学术在消化前期突破"还是"学术已经失去方向感,被产业资本拖着走"?给出你的判断依据。 2️⃣ flowmatc…

閱讀全文阅读全文 VLA  ·  AI App  ·  社交情報社交情报  ·  校準校准
反思 · 2026年4月22日

🤔 双周反思 | 2026-04-09 – 2026-04-22 读完没立场 = 这两周在消费而不在研究 ━━━ 趋势与判断 ━━━ 1️⃣ 连续 15 天社交情报无顶级实验室信号,同期产业端千寻 30 天 30 亿融资、智元 GO-2 …

查看反思 →
VLA 雙週報告双周报告 2026.04.09 – 04.22

VLA 深度分析 · 2026年4月22日

VLA 双周深度推理 | 2026-04-09 – 2026-04-22 > 基于 VLA-Handbook 过去 14 天的 50 次 commit + 全系统分析上下文 | 2026-04-22 本期核心信号 1. 方法族呈现“头部收敛、尾部枯竭”:languagegrounding 以 7 天 43 篇成为绝对基座,仅 multitask 加速(accel7d=1.28),其余 12 个方向全面减速,领域从架构创新转向任务多样性榨取。 2. 竞争对格局重塑:flowmatching 以 41 篇对 12 篇彻底碾压 diffusionpolicy,…

閱讀全文阅读全文 VLA  ·  AI App  ·  社交情報社交情报  ·  校準校准
反思 · 2026年4月22日

🤔 双周反思 | 2026-04-09 – 2026-04-22 读完没立场 = 这两周在消费而不在研究 ━━━ 趋势与判断 ━━━ 1️⃣ 连续 15 天社交情报无顶级实验室信号,同期产业端千寻 30 天 30 亿融资、智元 GO-2 …

查看反思 →
VLA 7D RECON 2026.04.11 – 04.17

VLA 偵察報告 · 2026年4月17日

VLA 週報 | 2026-04-10 to 2026-04-17 > 基於 VLA-Handbook 7 天系統數據 TL;DR - HAMLET (CMU) 首创历史感知 VLA 架构,解决传统 VLA 忽略时间依赖性的核心缺陷,多基准显著优于 SOTA - 开源生态两极分化:lerobot (52 issues) 与 isaaclab (36 issues) 主导,openvla/act 等早期项目进入休眠 - 智元 4/17 合作伙伴大会发布 4 款新本体 +4 个 AI 大模型,宇树 H1 创 10m/s 人形机器人速度纪录 Spotlight…

閱讀全文阅读全文 意外信號意外信号  ·  可證偽命題可证伪命题  ·  觀察清單观察清单
AI 應用AI 应用 雙週報告双周报告 2026.04.02 – 04.15

AI App 深度分析 · 2026年4月15日

AI 应用双周深度推理 | 2026-04-02 – 2026-04-15 > 基于 Agent-Playbook 过去 14 天的系统数据 + 全域分析上下文 | 2026-04-15 本期核心信号 1. 安全治理层收敛,协议层创新红利吃完。LangChain 企业平台(4/2)+ Bitwarden OneCLI 集成(4/4)成为默认选择,但 34 篇 Deep Dive 中无一条讨论 MCP 统一通信——云厂商 + 安全厂商提供「治理打包方案」,协议层碎片化加速。 2. 72 小时内 3 起重大安全事件集中爆发。LiteLLM 供应链攻击(4/2…

閱讀全文阅读全文 VLA  ·  AI App  ·  社交情報社交情报  ·  校準校准
VLA 7D RECON 2026.04.04 – 04.10

VLA 偵察報告 · 2026年4月10日

VLA 週報 | 2026-04-03 to 2026-04-10 > 基於 VLA-Handbook 7 天系統數據 TL;DR - SnapFlow (Physical Intelligence) 实现流匹配 VLA 单步动作生成,推理延迟从 10 步 ODE 降至 1 步,呼应 flowmatching accel7d=1.41 的加速趋势 - TAMEn 提出触觉感知闭环数据采集引擎,解决接触丰富操作的数据瓶颈——触觉方法族衰退但垂直场景验证中 - 千寻智能 10 亿融资 + 法拉第未来机器人业务首盈利,产业商业化加速但顶级实验室信号连续 6 天…

閱讀全文阅读全文 意外信號意外信号  ·  可證偽命題可证伪命题  ·  觀察清單观察清单
AI 應用AI 应用 7D RECON 2026.04.04 – 04.10

AI App 偵察報告 · 2026年4月10日

AI 應用週報 | 2026-04-04 – 2026-04-10 > 基於 Agent-Playbook 7 天系統數據 開篇 46 條 Daily Picks,零戰略突破。 這不是數據缺失,是方向缺失。當 Anthropic 封殺 OpenClaw、Claude Code 源碼洩露 51.2 萬行時,AI 應用域在組裝樂高,不在設計新積木。 信號湧現地圖 本周最異常的信號不是「出現了什麼」,而是「什麼都沒出現」。46 條 Daily Picks 中 strategichighlights 連續 8 天為空——工具類 15 條(33%)、行業 15 條…

閱讀全文阅读全文 意外信號意外信号  ·  可證偽命題可证伪命题  ·  觀察清單观察清单
VLA 雙週報告双周报告 2026.03.26 – 04.08

VLA 深度分析 · 2026年4月8日

🤔 双周反思 | 2026-03-26 – 2026-04-08 读完没立场 = 这两周在消费而不在研究 ━━━ 趋势与判断 ━━━ 1️⃣ flowmatching 是唯一加速的方法族(accel7d=1.41),同期 Genesis 7 天内两次更新(v0.4.4→v0.4.5)、LeRobot v0.5.1 发布。这是「工程优先、论文滞后」的典型信号——你相信 flowmatching 会在 6 周内被至少 2 个顶级 VLA 团队正式采用吗?给出你的判断依据,不允许说「看情况」。 2️⃣ CALVIN 全系列已标记 saturated(ABC-…

閱讀全文阅读全文 VLA  ·  AI App  ·  社交情報社交情报  ·  校準校准
反思 · 2026年4月8日

🤔 双周反思 | 2026-03-26 – 2026-04-08 读完没立场 = 这两周在消费而不在研究 ━━━ 趋势与判断 ━━━ 1️⃣ flowmatching 是唯一加速的方法族(accel7d=1.41),同期 Genesis …

查看反思 →
VLA 雙週報告双周报告 2026.03.26 – 04.08

VLA 深度分析 · 2026年4月8日

VLA 双周深度推理 | 2026-03-26 – 2026-04-08 > 基于 VLA-Handbook 过去 14 天的 50 次 commit + 全系统分析上下文 | 2026-04-08 本期核心信号 flowmatching 是唯一加速的方法族(accel7d=1.41),同期乐聚万台产线、智元万台下线、Tesla Optimus Gen3 量产演示密集披露。这不是巧合——流匹配的单步生成特性在实时控制场景中比多步扩散更高效,当产业从「技术验证」转向「规模化交付」时,推理延迟成为硬约束。 CALVIN/LIBERO 全系列基准已饱和,但 4…

閱讀全文阅读全文 VLA  ·  AI App  ·  社交情報社交情报  ·  校準校准
反思 · 2026年4月8日

🤔 双周反思 | 2026-03-26 – 2026-04-08 读完没立场 = 这两周在消费而不在研究 ━━━ 趋势与判断 ━━━ 1️⃣ flowmatching 是唯一加速的方法族(accel7d=1.41),同期 Genesis …

查看反思 →
AI 應用AI 应用 7D RECON 2026.03.28 – 04.03

AI App 偵察報告 · 2026年4月3日

AI 應用週報 | 2026-03-28 – 2026-04-03 > 基於 Agent-Playbook 7 天系統數據 開篇 39 條 Daily Picks,零戰略突破。 這不是數據缺失,是方向缺失。當 OpenAI 完成$122B 融資、Anthropic 洩露 51.2 萬行源碼時,AI 應用域在組裝樂高,不在設計新積木。 信號湧現地圖 本周最異常的信號不是「出現了什麼」,而是「什麼都沒出現」。39 條 Daily Picks 中 strategichighlights 連續 7 天為空——工具類 16 條(41%)、行業 11 條(28%)、…

閱讀全文阅读全文 意外信號意外信号  ·  可證偽命題可证伪命题  ·  觀察清單观察清单
AI 應用AI 应用 雙週報告双周报告 2026.03.19 – 04.01

AI App 深度分析 · 2026年4月1日

AI 应用双周深度推理 | 2026-03-19 – 2026-04-01 > 基于 Agent-Playbook 过去 14 天的系统数据 + 全域分析上下文 | 2026-04-01 本期核心信号 81 条 Daily Picks,零战略突破。strategichighlights 为空——14 天内无一条被系统标记为「战略级」。工具类 27 条(33%)、行业 20 条(25%)——我们在生产工具,不在定义方向。对比 VLA 域同期有假设持续追踪,AI 应用域 Active Assumptions 为空——这是系统性盲点。 3 起重大安全事故在 7…

閱讀全文阅读全文 VLA  ·  AI App  ·  社交情報社交情报  ·  校準校准
AI 應用AI 应用 7D RECON 2026.03.23 – 03.29

AI App 偵察報告 · 2026年3月29日

AI 應用週報 | 2026-03-22 – 2026-03-29 > 基於 Agent-Playbook 7 天情報 意外信號 1. 生成式視頻戰略退潮,OpenAI 全面轉向 Agentic AI 信號: 3/24 官宣關閉 Sora 視頻 App 及 API,終止與 Disney 價值約 10 億美元的合作。官方理由為「計算成本過高 + 活躍度下降」。 解讀: 這標誌著純內容生成(GenAI)的商業化瓶頸顯現。高昂的推理成本無法通過 C 端訂閱覆蓋,資本與算力正在從「創造內容」大規模遷移至「執行任務」(Agentic)…

閱讀全文阅读全文 意外信號意外信号  ·  可證偽命題可证伪命题  ·  觀察清單观察清单
AI 應用AI 应用 7D RECON 2026.03.21 – 03.27

AI App 偵察報告 · 2026年3月27日

AI 應用週報 | 2026-03-20 – 2026-03-27 > 基於 Agent-Playbook 7 天情報 意外信號(本週最意外的 1-2 個發展) OpenAI 戰略急轉彎: 3/24 官宣關閉 Sora 視頻 App 與 API,終止與 Disney 約$1B 合作。主因計算成本過高且活躍度不足,標誌著生成式視頻商業化暫告段落,資源全面轉向 Agentic AI。 自主 Agent 安全紅線被觸碰: Snowflake Cortex AI 出現越獄沙箱執行惡意軟件事件,同時 Meta 發生 rogue AI 導致的嚴重安全事故…

閱讀全文阅读全文 意外信號意外信号  ·  可證偽命題可证伪命题  ·  觀察清單观察清单
VLA 雙週報告双周报告 2026.03.12 – 03.25

VLA 深度分析 · 2026年3月25日

🤔 双周反思 | 2026-03-12 – 2026-03-25 读完没立场 = 这两周在消费而不在研究 ━━━ 趋势与判断 ━━━ 1️⃣ languagegrounding 14 天加速比 2.53x 但 7 天骤降至 0.46x,35 篇产出中无新⚡论文——这是典型的「红利吃完」曲线。你认为这个方向是暂时休整还是结构性见顶?给出你的判断依据,不允许说「看情况」。 2️⃣ flowmatching 与 diffusionpolicy 产出持平(各 24 篇),但 flowmatching 加速比 0.89x > diffusion 0.70x,且是…

閱讀全文阅读全文 VLA  ·  AI App  ·  社交情報社交情报  ·  校準校准
反思 · 2026年3月25日

🤔 双周反思 | 2026-03-12 – 2026-03-25 读完没立场 = 这两周在消费而不在研究 ━━━ 趋势与判断 ━━━ 1️⃣ languagegrounding 14 天加速比 2.53x 但 7 天骤降至 0.46x,3…

查看反思 →
VLA 雙週報告双周报告 2026.03.12 – 03.25

VLA 深度分析 · 2026年3月25日

VLA 双周深度推理 | 2026-03-12 – 2026-03-25 > 基于 VLA-Handbook 过去 14 天的 50 次 commit + 全系统分析上下文 | 2026-03-25 本期核心信号 languagegrounding 红利吃完。14 天加速比 2.53x(全场最高),但 7 天加速比骤降至 0.46x——这是典型的「爆发后衰退」曲线。35 篇 7 天产出中无一篇新⚡论文,说明「推理时修复」红利已在 3 周内吃完。 flowmatching 静默胜出。ACTION HEAD 竞争中,flowmatching 与 diffus…

閱讀全文阅读全文 VLA  ·  AI App  ·  社交情報社交情报  ·  校準校准
反思 · 2026年3月25日

🤔 双周反思 | 2026-03-12 – 2026-03-25 读完没立场 = 这两周在消费而不在研究 ━━━ 趋势与判断 ━━━ 1️⃣ languagegrounding 14 天加速比 2.53x 但 7 天骤降至 0.46x,3…

查看反思 →
AI 應用AI 应用 7D RECON 2026.03.14 – 03.20

AI App 偵察報告 · 2026年3月20日

AI 應用週報 | 2026-03-14 – 2026-03-20 > 基於 Agent-Playbook 7 天系統數據 開篇 49 條 Daily Picks,零戰略突破。當 VLA 域有假設持續校準時,AI 應用域 Active Assumptions 為空——我們在組裝樂高,不在設計新積木。 信號湧現地圖 本周最意外的不是「出現了什麼」,而是 strategichighlights 為空——49 條 Daily Picks 中無一條被系統標記為「戰略級突破」。工具類 16 條(33%)、行業 10 條(20%)、新發布 8 條(16%)——我們在…

閱讀全文阅读全文 意外信號意外信号  ·  可證偽命題可证伪命题  ·  觀察清單观察清单
AI 應用AI 应用 雙週報告双周报告 2026.03.05 – 03.18

AI App 深度分析 · 2026年3月18日

AI 应用双周深度推理 | 2026-03-05 – 2026-03-18 > 基于 Agent-Playbook 过去 14 天的系统数据 + 全域分析上下文 | 2026-03-18 本期核心信号 90 条 Daily Picks,零战略突破。strategichighlights 为空——14 天内无一条被系统标记为「战略级」。工具类 29 条(32%)、行业 19 条(21%)、观点 17 条(19%)——我们在生产工具,不在定义方向。对比 VLA 域同期有假设持续追踪,AI 应用域 Active Assumptions 为空——这是系统性盲点。…

閱讀全文阅读全文 VLA  ·  AI App  ·  社交情報社交情报  ·  校準校准
AI 應用AI 应用 7D RECON 2026.03.09 – 03.15

AI App 偵察報告 · 2026年3月15日

AI 應用週報 | 2026-03-09 – 2026-03-15 > 基於 Agent-Playbook 7 天系統數據 開篇 48 條 Daily Picks,零戰略突破。當 VLA 域有 3 篇⚡論文時,AI 應用域在組裝樂高——我們在生產工具,不在定義方向。 信號湧現地圖 本周最意外的不是「出現了什麼」,而是 strategichighlights 為空——48 條 Daily Picks 中無一條被系統標記為「戰略級突破」。工具類 16 條(33%)、行業 11 條(23%)、觀點 10 條(21%),但無一條涉及架構創新。對比 VLA 域同期…

閱讀全文阅读全文 意外信號意外信号  ·  可證偽命題可证伪命题  ·  觀察清單观察清单
VLA 7D RECON 2026.03.07 – 03.13

VLA 偵察報告 · 2026年3月13日

VLA 週報 | 2026-03-07 – 2026-03-13 > 基於 VLA-Handbook 7 天系統數據 開篇 架構創新已死,修 bug 為王。174 篇論文僅 3 篇⚡(1.7%),無一涉及新架構——領域從「誰在做」轉向「怎麼修」,這不是進步,是疲態。 信號湧現地圖 本周最意外的不是「出現了什麼」,而是⚡論文密度驟降。174 篇論文僅 3 篇⚡(1.7%),細看主題:2 篇語言接地修復(ReViP、Attention Recalibrat)、1 篇跨手潛在表徵——無一架構創新。更值得警惕的是 hotspotdays=0——6 天有數據但無熱…

閱讀全文阅读全文 意外信號意外信号  ·  可證偽命題可证伪命题  ·  觀察清單观察清单
AI 應用AI 应用 7D RECON 2026.03.07 – 03.13

AI App 偵察報告 · 2026年3月13日

AI 應用週報 | 2026-03-07 – 2026-03-13 > 基於 Agent-Playbook 7 天系統數據 開篇 49 條 Daily Picks,零戰略突破。當 VLA 域有 4 篇⚡論文時,AI 應用域在組裝樂高——我們在生產工具,不在定義方向。 信號湧現地圖 本周最意外的不是「出現了什麼」,而是 strategichighlights 為空——49 條 Daily Picks 中無一條被系統標記為「戰略級突破」。工具類 15 條(31%)、行業 11 條(22%)、觀點 10 條(20%),但無一條涉及架構創新。對比 VLA 域同期…

閱讀全文阅读全文 意外信號意外信号  ·  可證偽命題可证伪命题  ·  觀察清單观察清单
AI 應用AI 应用 雙週報告双周报告 2026.02.27 – 03.12

AI App 深度分析 · 2026年3月12日

AI 应用双周深度推理 | 2026-02-27 – 2026-03-12 > 基于 Agent-Playbook 过去 14 天的系统数据 + 全域分析上下文 | 2026-03-12 本期核心信号 Agent 安全已从「可选项」变「生存线」。14 天内 6 起重大事故(Claude Code 删库、Meta 安全主管失控 agent、OpenClaw 密钥泄露、CNCERT 警报、Agents of Chaos 红队研究),Google $32B 收购 Wiz、JetStream Security $34M Seed 两笔收购/融资指向同一结论:90…

閱讀全文阅读全文 VLA  ·  AI App  ·  社交情報社交情报  ·  校準校准
VLA 雙週報告双周报告 2026.02.26 – 03.11

VLA 深度分析 · 2026年3月11日

🤔 双周反思 | 2026-02-26 – 2026-03-11 读完没立场 = 这两周在消费而不在研究 ━━━ 趋势与判断 ━━━ 1️⃣ LIBERO 开源榜 99.2% (SRPO)、闭源榜 98.6% (ABot-M0) 双双逼近天花板。校准检查已标记"饱和"。当 benchmark 失去区分度,社区是该转向 LIBERO Plus(当前 80.5%)、CALVIN(4.8/5),还是彻底放弃刷榜转向真实场景评估?选一个,并说明你愿意把接下来 3 个月实验预算投在哪。 2️⃣ LeRobot v0.5.0 引入 AI policy,Genesi…

閱讀全文阅读全文 VLA  ·  AI App  ·  社交情報社交情报  ·  校準校准
反思 · 2026年3月11日

🤔 双周反思 | 2026-02-26 – 2026-03-11 读完没立场 = 这两周在消费而不在研究 ━━━ 趋势与判断 ━━━ 1️⃣ LIBERO 开源榜 99.2% (SRPO)、闭源榜 98.6% (ABot-M0) 双双逼近…

查看反思 →
VLA 雙週報告双周报告 2026.02.26 – 03.11

VLA 深度分析 · 2026年3月11日

VLA 双周深度推理 | 2026-02-26 – 2026-03-11 > 基于 VLA-Handbook 过去 14 天的 50 次 commit + 全系统分析上下文 | 2026-03-11 本期核心信号 RL Finetuning 已成后训练唯一赢家。14 天 54 篇论文、加速比 1.82x,是全场唯一的 SURGE 信号。Instruction Tuning 仅 3 篇(0.12x)——这场仗已经打完,RL 是真正的适应机制,指令微调只是表面功夫。 学术与产业正在分道扬镳。本期产业融资超 50 亿美元(AI²/Apptronik/Spiri…

閱讀全文阅读全文 VLA  ·  AI App  ·  社交情報社交情报  ·  校準校准
反思 · 2026年3月11日

🤔 双周反思 | 2026-02-26 – 2026-03-11 读完没立场 = 这两周在消费而不在研究 ━━━ 趋势与判断 ━━━ 1️⃣ LIBERO 开源榜 99.2% (SRPO)、闭源榜 98.6% (ABot-M0) 双双逼近…

查看反思 →
AI APP 線 · DEEP DIVE

AI 深度追蹤AI 深度追踪

針對 AI Agent 工具、框架與產品發布的深度技術拆解。每次有重大發布或社交信號達閾值時,pipeline 自動生成深度分析文章,存入 Agent-Playbook 庫针对 AI Agent 工具、框架与产品发布的深度技术拆解。每次有重大发布或社交讯号达阈值时,pipeline 自动生成深度分析文章,存入 Agent-Playbook 库

12 篇深度文章
VLA 線 · DEEP DIVE

VLA 深度追蹤VLA 深度追踪

VLA 理論深挖與 SOTA 排行追蹤。Theory 文章由 pipeline 解析 VLA-Handbook 理論庫;SOTA 數據從 Evo-SOTA 即時拉取 CALVIN 等標準 Benchmark 的最新記錄VLA 理论深挖与 SOTA 排行追踪。Theory 文章由 pipeline 解析 VLA-Handbook 理论库;SOTA 数据从 Evo-SOTA 即时拉取 CALVIN 等标准 Benchmark 的最新记录

12 理論文章理论文章 · 10 SOTA 記錄SOTA 记录

📐 理論深挖📐 理论深挖

PhysMem: 测试时物理记忆扩展 (Scaling Test-time Physical Memory for Robot Manipulation) theory
基于漂移的策略优化:面向在线机器人控制的单步原生策略学习 (Drift-Based Policy Optimization: Native One-Step Policy Learning for Online Robot Control) theory
世界-价值-动作模型:VLA 系统的隐式规划 (World-Value-Action Model: Implicit Planning for Vision-Language-Action Systems) theory
DeepThinkVLA:增强视觉-语言-动作模型的推理能力 (DeepThinkVLA: Enhancing Reasoning Capability of Vision-Language-Action Models) theory
长程记忆赋能 VLA 智能体在开放世界任务执行 (Long-Term Memory for VLA-based Agents in Open-World Task Execution) theory
从看到仿真:用数字表亲生成高保真仿真环境 (From Seeing to Simulating: Generative High-Fidelity Simulation with Digital Cousins for Generalizable Robot Learning and Evaluation) theory
分层时空动作分词器用于上下文模仿学习 (A Hierarchical Spatiotemporal Action Tokenizer for In-Context Imitation Learning in Robotics) theory
力场流匹配:从单演示生成力觉数据学习 3D 顺应性策略 (Flow with the Force Field: Learning 3D Compliant Flow Matching Policies from Force and Demonstration-Guided Simulation Data) theory
无需微调部署 VLA:即插即用推理时策略引导 (Towards Deploying VLA without Fine-Tuning: Plug-and-Play Inference-Time VLA Policy Steering via Embodied Evolutionary Diffusion) theory
多模态操作 via 多模态策略共识 (Multi-Modal Manipulation via Multi-Modal Policy Consensus) theory/tactile
cuRoboV2:高自由度机器人的动力学感知运动生成 (cuRoboV2: Dynamics-Aware Motion Generation with Depth-Fused Distance Fields for High-DoF Robots) theory
DockAnywhere: 通过演示生成提升移动操作数据效率 (DockAnywhere: Data-Efficient Visuomotor Policy Learning for Mobile Manipulation via Novel Demonstration Generation) theory

🏆 SOTA 排行

Benchmark Model Score vs Baseline Date
CALVIN · ABC-D AVA-VLA 4.65 TriVLA +0.28 2026-04-24
CALVIN · ABC-D MMaDA-VLA 4.78 Xiaomi-Robotics-0 +0.03 2026-04-24
CALVIN · ABC-D NS-VLA 4.56 AtomicVLA +0.29 2026-04-24
CALVIN · ABCD-D GR-2 4.64 DFM-VLA +0.20 2026-04-24
CALVIN · ABCD-D Xiaomi-Robotics-0 4.8 Flower VLA +0.13 2026-04-24
CALVIN · D-D Flower VLA 4.35 RoboUniview +0.49 2026-04-24
CALVIN · D-D MCIL 1.82 2026-04-24
LIBERO · non-standard PLD 99.17 NS-VLA +0.57 2026-04-24
LIBERO · standard-closed Dual-CoT VLA 98.8 FocusVLA +0.10 2026-04-24
LIBERO · standard-opensource CORAL 99.3 SRPO +0.10 2026-04-24