AGENT-PLAYBOOK · THEORY ARCHIVE
Agentic Engineering
學習知識庫学习知识库
AI AGENT TRENDS
high
AI AGENT TRENDS
▲ 1 accelerating 12 families · 55 mentions covered
FAMILY MOM 7d Δ7d CHART ST
Agentic Coding 20 4.00x
●
Open Source 9 2.25x
◉
Vertical Agent 6 0.75x
●
Eval / Bench 4 0.80x
●
Agent Infra 4 0.57x
●
MCP / Tool Protocol 3 1.00x
●
Reasoning 3 9.99x
●
Frontier Model 3 1.50x
●
Context Eng. 1 1.00x
●
Agent Safety 1 1.00x
●
Voice / Modal 1 0.50x
●
Multi-Agent 0 0.00x
●
COMPETITION PAIRS 5
SINGLE vs SWARM
Single powerful coding agent vs multi-agent orchestration
20 vs 0
· ratio —x
ACT vs THINK
Tool execution protocol vs context/knowledge retrieval
3 vs 1
· ratio 3.00x
OPEN vs CLOSED
Open-source models vs proprietary frontier models
9 vs 3
· ratio 3.00x
MEASURE vs GUARD
Evaluation-driven development vs safety-first guardrails
4 vs 1
· ratio 4.00x
SCALE vs SENSE
Infrastructure scaling vs multimodal perception
4 vs 1
· ratio 4.00x
TOP AI ORGS
10 active / 30d
TOP AI ORGS
ORGANIZATION TOTAL LAST SEEN ACTIVITY
1 OpenAI 53 04-24
2 Anthropic 37 04-22
3 Google 14 04-24
DeepSeek 10 04-24
NVIDIA 8 04-23
Amazon 7 04-21
Qwen 5 04-17
LangChain 5 04-10
Cursor 5 04-22
xAI 4 03-22
LlamaIndex 1 04-24
Hugging Face 1 03-10
Meta 1 03-10
Apple 1 03-10
Microsoft 1 03-11
✦ 不知道從哪裡開始?選一條路徑不知道从哪里开始?选一条路径
工程師入門工程师入门
從零建立完整的 Agentic 工程認知从零建立完整的 Agentic 工程认知
系統架構師系统架构师
設計可靠的多 Agent 控制平面與治理设计可靠的多 Agent 控制平面与治理
產品 / 戰略产品 / 战略
把握範式轉變,制定 AI 時代競爭策略把握范式转变,制定 AI 时代竞争策略
精選必讀精选必读
建立 Agentic 工程直覺的 8 篇核心文章建立 Agentic 工程直觉的 8 篇核心文章01
工程實戰工程实战
新手詞彙表新手词汇表
掌握 Agent 工程核心術語,第一篇必讀掌握 Agent 工程核心术语,第一篇必读
02
底層原理底层原理
Agent 心智模型Agent 心智模型
理解 Agent 如何「思考」的底層認知框架理解 Agent 如何"思考"的底层认知框架
03
工程實戰工程实战
Context 工程手冊Context 工程手册
從壓縮到結構化注入的完整方法論从压缩到结构化注入的完整方法论
04
工程實戰工程实战
T1–T6 故障分類法T1–T6 故障分类法
生產部署前必讀的 Agent 失敗模式大全生产部署前必读的 Agent 失败模式大全
05
工程實戰工程实战
信任分層設計信任分层设计
防止 Agent 越權的多層級權限架構防止 Agent 越权的多层级权限架构
06
工程實戰工程实战
評估環路即生產實踐评估环路即生产实践
把評估從測試階段提升為持續生產實踐把评估从测试阶段提升为持续生产实践
07
工程實戰工程实战
委托而非自動化委托而非自动化
重新定義 Agent 與人類協作的工程邊界重新定义 Agent 与人类协作的工程边界
08
戰略生存战略生存
Agent 原生組織角色Agent 原生组织角色
Agent 時代的職能重構與角色設計Agent 时代的职能重构与角色设计
PULSAR 深度分析深度分析
50 篇 · Pipeline 自動生成篇 · Pipeline 自动生成 significant_updatesignificant_update Vidoc Security 复现 Anthropic Mythos 发现:用公开模型验证安全研究 significant_updatesignificant_update Qwen3.6-35B-A3B: Agentic coding power, now open to all significant_updatesignificant_update Anthropic 推出 Claude Design:由 Anthropic Labs 开发的新产品线 significant_updatesignificant_update Claude 4.7 Tokenizer 成本实测:新分词器如何影响你的账单 significant_updatesignificant_update 要做电商 Agent OS,前钉钉最年轻副总裁创立的「攀峰智能」完成数千万天使轮 significant_updatesignificant_update The next evolution of the Agents SDK significant_updatesignificant_update Show HN: Libretto – Making AI browser automations deterministic significant_updatesignificant_update Claude Code Routines significant_updatesignificant_update Show HN: LangAlpha – what if Claude Code was built for Wall Street? significant_updatesignificant_update Trusted access for the next era of cyber defense significant_updatesignificant_update Show HN: Plain – The full-stack Python framework designed for humans and agents significant_updatesignificant_update Hermes Agent v0.8.0:4.8 万星的自学习开源 Agent 框架 significant_updatesignificant_update EinsteinArena:AI Agent 协作科学发现平台 significant_updatesignificant_update AWS Lambda + Amazon Nova:可扩展奖励函数构建教程 significant_updatesignificant_update Anthropic Project Glasswing:限制 Claude Mythos 仅供安全研究人员 significant_updatesignificant_update Show HN: Claudraband – Claude Code for the Power User significant_updatesignificant_update European AI. A playbook to own it significant_updatesignificant_update Cirrus Labs to join OpenAI significant_updatesignificant_update Meta Muse Spark 发布:Llama 4 后首个模型,meta.ai 集成新工具 significant_updatesignificant_update Nanocode: The best Claude Code that $200 can buy in pure JAX on TPUs significant_updatesignificant_update Your harness, your memory significant_updatesignificant_update How We Broke Top AI Agent Benchmarks: And What Comes Next significant_updatesignificant_update Multimodal Embedding & Reranker Models with Sentence Transformers significant_updatesignificant_update Show HN: FluidCAD – Parametric CAD with JavaScript significant_updatesignificant_update ALTK-Evolve:IBM 研发 Agent 在职学习框架 significant_updatesignificant_update The future of managing agents at scale: AWS Agent Registry now in preview significant_updatesignificant_update Deep Agents Deploy: an open alternative to Claude Managed Agents significant_updatesignificant_update Claude Managed Agents 正式发布 significant_updatesignificant_update Google Research 发布两个学术 AI Agent:图表优化 + 同行评审辅助 significant_updatesignificant_update Arcade.dev MCP 工具集集成 LangSmith Fleet significant_updatesignificant_update OpenAI 收购科技播客 TBPN 深度文章深度文章 AWS Bedrock AgentCore Runtime:状态化 MCP 客户端能力 significant_updatesignificant_update GLM-5.1:Z.ai 开源 754B 参数长程任务模型 significant_updatesignificant_update LangChain Deep Agents v0.5:异步子代理 + 多模态文件系统 significant_updatesignificant_update Launch HN: Freestyle – Sandboxes for Coding Agents significant_updatesignificant_update Google AI Edge Gallery significant_updatesignificant_update TurboQuant-WASM – Google 向量量化技术登陆浏览器 significant_updatesignificant_update Codex pricing to align with API token usage, instead of per-message significant_updatesignificant_update Running Gemma 4 locally with LM Studio's new headless CLI and Claude Code significant_updatesignificant_update How My Agents Self-Heal in Production — 生产环境 Agent 自愈管道 significant_updatesignificant_update 小米 MiMo 大模型联合 OpenClaw/OpenCode/KiloCode 等 Agent 框架,首周限免开放 significant_updatesignificant_update DeepSeek V4 优先适配国产 AI 芯片 significant_updatesignificant_update Vulnerability Research Is Cooked — Coding Agents 正在重塑安全研究 深度文章深度文章 Accelerate agentic tool calling with serverless model customization in Amazon SageMaker AI significant_updatesignificant_update Cursor 3 正式发布 significant_updatesignificant_update March 2026: LangChain Newsletter - LangSmith Fleet (formerly Agent Builder) significant_updatesignificant_update Claude Code 用户用量消耗速度远超预期,Anthropic 调整限流策略 significant_updatesignificant_update Claude Code 源码通过 npm map 文件泄露,社区逆向分析架构细节 significant_updatesignificant_update Axios 遭供应链攻击,恶意依赖包通过 npm 分发 significant_updatesignificant_update Bitwarden integrates with OneCLI agent vault
全部文章
82 篇 · 點擊模塊過濾篇 · 点击模块过滤 底層原理底层原理 11 篇篇
Agent 的心智模型:从"做题家"到"管理者" AlphaOPT:构建可进化的优化建模经验库 LoFA vs RAG:两种不同的“知识注入”路径 mHC 範式:具身智能與大規模模型中的信號守恆 Post-Scaling Research Age:把“更聪明地用算力”落到工程清单 WaveFormer:用欠阻尼波动方程做全局视觉建模(Frequency-Time 解耦) 不確定性處理與貝葉斯估計 (Bayesian Estimation & Uncertainty) 深度解析:Hypernetwork (超网络) 獨立推理與證明邏輯 (Independent Reasoning & Proof Logic) 锯齿状智能与 RLVR:理解 2025 推理模型 隐空间推理:Coconut 与连续思维链 (Continuous CoT)
Agent 設計Agent 设计 15 篇篇
01 组织模型与角色分工(Operating Model & Roles) 03 Playbook:多 Agent 编队协作(Multi-Agent Squad) Agent UI / Agent API 設計模式 (Agent UI & API Design Patterns) Agent 交互模型:角色、职责与闭环反馈 Agent 存储选型:SQLite, MySQL 还是 PostgreSQL? Agent 执行环境:云端沙箱全权限 vs 本地受控执行(选型与折中) Agent 记忆系统:短期(上下文工程)到长期(可审计的外部记忆)架构 AI Coding 智能体架构设计模式 RAG:Agent 的外部长期记忆库 vLLM 语义路由(Semantic Routing):把“模型选择 + 安全 + 缓存 + 质量”做成一个路由层 推理编排与元系统:榨干 LLM 的最后一滴潜力 架构分析:Skill 与 MCP 的边界与配合 灯塔 vs 火把:Agent 选型决策框架 知识蒸馏:让 Agent 拥有万级文件的“上帝视角” 社会模拟与多智能体预测系统 (Social Simulation & MAS)
工程實戰工程实战 核心模塊核心模块 26 篇篇
01-物理层治理:项目组织与结构导轨 02 Playbook:从 Spec 到 PR(Spec → PR Delivery) 02-逻辑层治理:编码规范与契约 03-流程层治理:审查与协同闭环 04 Playbook:风险治理与回滚(Risk & Rollback) 04-自动化执法:让架构导轨“带电” 05 Playbook:Ralph Loop 迭代範式与 AFK 指挥 05-架构决策记录 (ADR):给 AI 建一座记忆宫殿 10x 开发者集成战术链路手册 Agent 信任層級設計 (Trust Tier Design) Agent 失效分類學 (Agent Failure Taxonomy) Agentic Coding 的本质:文档工程(DocOps) Agentic 控制平面設計 (Agentic Control Plane Design) AI 原生调试:从手动 Profiling 到 Agentic 诊断 AI 参与编码的检测、度量与治理:从“偷偷用”到“系统化基本功” AI應用開發知識系統整體設計 Context 工程實戰指南 (Context Engineering Field Guide) Eval Loop 作為生產實踐 (Eval Loop as Production Practice) Hybrid DocOps + AgentOps:一套可落地的 Agentic Coding 最佳实践 Playbook:Agent 评估体系(Evals)从 0 到 1 PRD(写给工程师与 LLM Agent 的可执行模板) 委派而非自動化:工程原則 (Delegation, Not Automation) 数字化工作室:设计你的代理组织架构 (Agentic Org Chart) 架构导轨:防止 AI 在大型项目中失控的治理艺术 架构治理 (Architectural Governance) 专项指南 架构治理:小白版黑话词典 (Glossary for Beginners)
範式轉變范式转变 10 篇篇
《A Year Of Vibes》读后:Prompt 版本控制、协作界面与“责任归属” 2025 LLM 现状:进展、问题、以及对 2026 的工程预测(Raschka 摘要提纯) Anthropic 2026 Agentic Coding 趋势报告:8 大趋势 × 4 个组织优先级(工程化读法) Vibe Coding 范式:从意图驱动开发到 Agentic Engineering 一人 CEO 范式:Agent 时代的个体组织力 不再為人設計:新文明的軟體範式與經驗清空 大白话:当扫地机开始自己“发工资” (aGDP 详解) 智能作为一种资源:可编织与可协作的未来 真实性危机:当 AI 民主化演变成“噪音民主化” 知识平权与智力成本的扁平化
戰略生存战略生存 13 篇篇
Agent-Native 組織新角色 (Agent-Native Organization Roles) AI 教育革命:终结百年的工业模式 AI 时代程序员的核心硬实力:三大理解心法 Vibe Coding 时代的发布摩擦力:国内 vs 海外 Vibe Coding 时代的独立开发者收款与出海实操指南 X(Twitter)生态生存手册:从“免费公地”到“付费帝国”的分发规则 以人为中心的 Agent 设计:主体性、氛围感与空间化 后端工程师进化:从“实现者”到“架构编排师” 智力套利策略:利用平权智力寻找利基机会 梯度下降人生法:对抗 AI 时代的惶恐 研究品味:作为决策中的“值函数” 跨境 AI 创业:身份/结构/合规/退出路径的决策清单(以 Manus 讨论为引子) 重构工程心智:跨越 AI 时代的 10 倍效率鸿沟