AGENT-PLAYBOOK · THEORY ARCHIVE
Agentic Engineering
學習知識庫学习知识库
AI AGENT TRENDS
high
AI AGENT TRENDS
▲ 3 accelerating 11 families · 27 mentions covered
FAMILY MOM 7d Δ7d CHART ST
Agentic Coding 6 0.38x
●
Frontier Model 5 0.83x
●
Vertical Agent 5 1.00x
●
Agent Infra 4 2.00x
◉
MCP / Tool Protocol 2 2.00x
◉
Voice / Modal 2 9.99x
●
Reasoning 2 2.00x
◉
Multi-Agent 1 9.99x
●
Context Eng. 0 0.00x
●
Agent Safety 0 0.00x
●
Eval / Bench 0 0.00x
●
COMPETITION PAIRS 5
SINGLE vs SWARM
Single powerful coding agent vs multi-agent orchestration
6 vs 1
· ratio 6.00x
ACT vs THINK
Tool execution protocol vs context/knowledge retrieval
2 vs 0
· ratio —x
SCALE vs SENSE
Infrastructure scaling vs multimodal perception
4 vs 2
· ratio 2.00x
TOP AI ORGS
15 active / 30d
TOP AI ORGS
ORGANIZATION TOTAL LAST SEEN ACTIVITY
1 OpenAI 87 06-10
2 Anthropic 61 06-10
3 DeepSeek 32 06-05
Google 24 06-10
NVIDIA 12 05-24
Cursor 11 05-28
Amazon 11 06-09
xAI 8 05-14
LangChain 5 05-21
Qwen 5 05-21
Apple 4 06-09
Mistral 4 05-18
Meta 3 05-11
Microsoft 2 05-27
LlamaIndex 2 05-17
✦ 不知道從哪裡開始?選一條路徑不知道从哪里开始?选一条路径
工程師入門工程师入门
從零建立完整的 Agentic 工程認知从零建立完整的 Agentic 工程认知
系統架構師系统架构师
設計可靠的多 Agent 控制平面與治理设计可靠的多 Agent 控制平面与治理
產品 / 戰略产品 / 战略
把握範式轉變,制定 AI 時代競爭策略把握范式转变,制定 AI 时代竞争策略
精選必讀精选必读
建立 Agentic 工程直覺的 8 篇核心文章建立 Agentic 工程直觉的 8 篇核心文章01
工程實戰工程实战
新手詞彙表新手词汇表
掌握 Agent 工程核心術語,第一篇必讀掌握 Agent 工程核心术语,第一篇必读
02
底層原理底层原理
Agent 心智模型Agent 心智模型
理解 Agent 如何「思考」的底層認知框架理解 Agent 如何"思考"的底层认知框架
03
工程實戰工程实战
Context 工程手冊Context 工程手册
從壓縮到結構化注入的完整方法論从压缩到结构化注入的完整方法论
04
工程實戰工程实战
T1–T6 故障分類法T1–T6 故障分类法
生產部署前必讀的 Agent 失敗模式大全生产部署前必读的 Agent 失败模式大全
05
工程實戰工程实战
信任分層設計信任分层设计
防止 Agent 越權的多層級權限架構防止 Agent 越权的多层级权限架构
06
工程實戰工程实战
評估環路即生產實踐评估环路即生产实践
把評估從測試階段提升為持續生產實踐把评估从测试阶段提升为持续生产实践
07
工程實戰工程实战
委托而非自動化委托而非自动化
重新定義 Agent 與人類協作的工程邊界重新定义 Agent 与人类协作的工程边界
08
戰略生存战略生存
Agent 原生組織角色Agent 原生组织角色
Agent 時代的職能重構與角色設計Agent 时代的职能重构与角色设计
PULSAR 深度分析深度分析
50 篇 · Pipeline 自動生成篇 · Pipeline 自动生成 significant_updatesignificant_update NVIDIA Nemotron 3 Ultra 上线 SageMaker JumpStart:550B MoE 专为 Agent 编排设计 深度文章深度文章 🎯 AWS Bedrock AgentCore 支持云端托管 Claude Code / Codex / Cursor 等编程 Agent significant_updatesignificant_update Gemma 4 12B: Google 发布 encoder-free 多模态模型,16GB 显存即可本地运行 significant_updatesignificant_update 🎯 Weaviate Engram GA:Agent 记忆与上下文管理正式商用 significant_updatesignificant_update AWS:用 SFT+DPO 提升 Agent 工具调用准确率 significant_updatesignificant_update Microsoft 发布 MAI-Thinking-1 (35B) 和 MAI-Code-1-Flash (5B):全自研 clean data 模型 significant_updatesignificant_update Microsoft Scout:基于 OpenClaw 的自主 AI Agent,7×24 后台自动执行 M365 任务 significant_updatesignificant_update OpenAI Voice Hack Night 现场演示「无 App 手机」agentic OS significant_updatesignificant_update OpenAI frontier models and Codex 正式登陆 Amazon Bedrock significant_updatesignificant_update Simon Willison:取消 AI 订阅可能才是解决方案 significant_updatesignificant_update ChatGPT for Google Sheets 存在数据外泄和钓鱼漏洞 significant_updatesignificant_update Multica: 开源托管 Agent 平台,让编码 Agent 成为正式队友 significant_updatesignificant_update Anthropic 公开 Claude 全产品线沙箱隔离方案:gVisor → Seatbelt → VM 三级架构 significant_updatesignificant_update Robinhood 开放 AI Agent 股票交易:MCP 接入 + 专属虚拟信用卡 significant_updatesignificant_update Claude Opus 4.8 发布:两个 0% 改写历史 + Dynamic Workflows 百 Agent 并行 significant_updatesignificant_update Mistral AI Now Summit:全栈欧洲 AI 战略,Voxtral 驱动 Alexa+,Vibe for Work 对标 Claude significant_updatesignificant_update Endava 用 Codex 构建 agentic 组织:需求分析从数周压缩至数天 significant_updatesignificant_update Qwen3.7-Max 闯入 Code Arena 编程榜全球第四,唯一非 Claude 模型 significant_updatesignificant_update Minicor (YC P26):Windows 桌面自动化 RPA 平台,自修复 Agent 规模化部署 significant_updatesignificant_update Amazon Bedrock AgentCore Payments:为 AI Agent 提供微交易支付基础设施 significant_updatesignificant_update Warp 宣布「开放敏捷开发」范式:GPT-5.5 驱动开源协作,Agent 贡献 90% PR significant_updatesignificant_update Simon Willison:Anthropic 和 OpenAI 已找到产品市场契合点——企业正在按 API 价格付费 significant_updatesignificant_update 微软按下 vibe coding 暂停键:烧 token 已经比员工贵了 significant_updatesignificant_update Microsoft Copilot Cowork 被曝数据外泄漏洞:Prompt 注入可窃取 OneDrive 文件 significant_updatesignificant_update Understand-Anything:代码库交互式知识图谱,GitHub Trending #1 significant_updatesignificant_update ECC (Everything Claude Code):38 Agent + 156 技能的开源 Agent Harness significant_updatesignificant_update 活过来的 Codex 扛起了 OpenAI 上市的希望 significant_updatesignificant_update DeepSeek Reasonix: DeepSeek 原生终端编码 Agent,高缓存+低成本 significant_updatesignificant_update Armin Ronacher: LLM 生成的 GitHub Issue 正在污染开源维护 深度文章深度文章 小米 MiMo 加入 API 价格战:永久降价 99%,全面对标 DeepSeek significant_updatesignificant_update Chrome DevTools MCP Server: 让编码 Agent 直接操控浏览器调试 深度文章深度文章 Claude Memory Files + Dreams + Conway:Anthropic 记忆架构大翻新 significant_updatesignificant_update Kanbots: Open source Kanban desktop app running parallel agents on every card significant_updatesignificant_update Runtime (YC P26) — 团队级沙盒编码 Agent 基础设施 significant_updatesignificant_update Gemini 3.5 Flash 正式发布:Google I/O 最快多模态模型 significant_updatesignificant_update Together AI:Coding Agent 推理基准测试,TPS 超 TensorRT-LLM 31% significant_updatesignificant_update IBM 发布 Open Agent Leaderboard:评估完整 Agent 系统而非单模型 significant_updatesignificant_update Cloudflare Project Glasswing: 用 Anthropic Mythos 测试 50+ 仓库安全漏洞 深度文章深度文章 AWS Bedrock AgentCore + MCP 集成 Quick Suite significant_updatesignificant_update 🎯 Semble: Code search for agents that uses 98% fewer tokens than grep 深度文章深度文章 AWS:Kiro CLI 通过 MCP 集成 Bedrock AgentCore Memory 实现跨会话记忆 significant_updatesignificant_update DeepSeek-V4-Flash means LLM steering is interesting again 深度文章深度文章 CLI-Anything:让所有软件 Agent-Native 深度文章深度文章 academic-research-skills:Claude Code 写论文全套流水线,6.4k Stars significant_updatesignificant_update DeepSeek V4 将于 4 月下旬正式发布 深度文章深度文章 Cerebras IPO 募资 55 亿美元,估值 400 亿 深度文章深度文章 Violin:开源视频翻译工具,ASR+LLM+TTS 全链路 significant_updatesignificant_update Anthropic 考虑 $9000B+ 估值新一轮融资,拟 10 月 IPO 深度文章深度文章 Anthropic "Code w/ Claude" 大会:Claude Platform 多智能体编排 + Claude Code 异步 Routines significant_updatesignificant_update OpenAI WebRTC 架构遭质疑:Voice AI 不该用 WebRTC
全部文章
82 篇 · 點擊模塊過濾篇 · 点击模块过滤 底層原理底层原理 11 篇篇
Agent 的心智模型:从"做题家"到"管理者" AlphaOPT:构建可进化的优化建模经验库 LoFA vs RAG:两种不同的“知识注入”路径 mHC 範式:具身智能與大規模模型中的信號守恆 Post-Scaling Research Age:把“更聪明地用算力”落到工程清单 WaveFormer:用欠阻尼波动方程做全局视觉建模(Frequency-Time 解耦) 不確定性處理與貝葉斯估計 (Bayesian Estimation & Uncertainty) 深度解析:Hypernetwork (超网络) 獨立推理與證明邏輯 (Independent Reasoning & Proof Logic) 锯齿状智能与 RLVR:理解 2025 推理模型 隐空间推理:Coconut 与连续思维链 (Continuous CoT)
Agent 設計Agent 设计 15 篇篇
01 组织模型与角色分工(Operating Model & Roles) 03 Playbook:多 Agent 编队协作(Multi-Agent Squad) Agent UI / Agent API 設計模式 (Agent UI & API Design Patterns) Agent 交互模型:角色、职责与闭环反馈 Agent 存储选型:SQLite, MySQL 还是 PostgreSQL? Agent 执行环境:云端沙箱全权限 vs 本地受控执行(选型与折中) Agent 记忆系统:短期(上下文工程)到长期(可审计的外部记忆)架构 AI Coding 智能体架构设计模式 RAG:Agent 的外部长期记忆库 vLLM 语义路由(Semantic Routing):把“模型选择 + 安全 + 缓存 + 质量”做成一个路由层 推理编排与元系统:榨干 LLM 的最后一滴潜力 架构分析:Skill 与 MCP 的边界与配合 灯塔 vs 火把:Agent 选型决策框架 知识蒸馏:让 Agent 拥有万级文件的“上帝视角” 社会模拟与多智能体预测系统 (Social Simulation & MAS)
工程實戰工程实战 核心模塊核心模块 26 篇篇
01-物理层治理:项目组织与结构导轨 02 Playbook:从 Spec 到 PR(Spec → PR Delivery) 02-逻辑层治理:编码规范与契约 03-流程层治理:审查与协同闭环 04 Playbook:风险治理与回滚(Risk & Rollback) 04-自动化执法:让架构导轨“带电” 05 Playbook:Ralph Loop 迭代範式与 AFK 指挥 05-架构决策记录 (ADR):给 AI 建一座记忆宫殿 10x 开发者集成战术链路手册 Agent 信任層級設計 (Trust Tier Design) Agent 失效分類學 (Agent Failure Taxonomy) Agentic Coding 的本质:文档工程(DocOps) Agentic 控制平面設計 (Agentic Control Plane Design) AI 原生调试:从手动 Profiling 到 Agentic 诊断 AI 参与编码的检测、度量与治理:从“偷偷用”到“系统化基本功” AI應用開發知識系統整體設計 Context 工程實戰指南 (Context Engineering Field Guide) Eval Loop 作為生產實踐 (Eval Loop as Production Practice) Hybrid DocOps + AgentOps:一套可落地的 Agentic Coding 最佳实践 Playbook:Agent 评估体系(Evals)从 0 到 1 PRD(写给工程师与 LLM Agent 的可执行模板) 委派而非自動化:工程原則 (Delegation, Not Automation) 数字化工作室:设计你的代理组织架构 (Agentic Org Chart) 架构导轨:防止 AI 在大型项目中失控的治理艺术 架构治理 (Architectural Governance) 专项指南 架构治理:小白版黑话词典 (Glossary for Beginners)
範式轉變范式转变 10 篇篇
《A Year Of Vibes》读后:Prompt 版本控制、协作界面与“责任归属” 2025 LLM 现状:进展、问题、以及对 2026 的工程预测(Raschka 摘要提纯) Anthropic 2026 Agentic Coding 趋势报告:8 大趋势 × 4 个组织优先级(工程化读法) Vibe Coding 范式:从意图驱动开发到 Agentic Engineering 一人 CEO 范式:Agent 时代的个体组织力 不再為人設計:新文明的軟體範式與經驗清空 大白话:当扫地机开始自己“发工资” (aGDP 详解) 智能作为一种资源:可编织与可协作的未来 真实性危机:当 AI 民主化演变成“噪音民主化” 知识平权与智力成本的扁平化
戰略生存战略生存 13 篇篇
Agent-Native 組織新角色 (Agent-Native Organization Roles) AI 教育革命:终结百年的工业模式 AI 时代程序员的核心硬实力:三大理解心法 Vibe Coding 时代的发布摩擦力:国内 vs 海外 Vibe Coding 时代的独立开发者收款与出海实操指南 X(Twitter)生态生存手册:从“免费公地”到“付费帝国”的分发规则 以人为中心的 Agent 设计:主体性、氛围感与空间化 后端工程师进化:从“实现者”到“架构编排师” 智力套利策略:利用平权智力寻找利基机会 梯度下降人生法:对抗 AI 时代的惶恐 研究品味:作为决策中的“值函数” 跨境 AI 创业:身份/结构/合规/退出路径的决策清单(以 Manus 讨论为引子) 重构工程心智:跨越 AI 时代的 10 倍效率鸿沟