视频链接:Don't Build Agents, Build Skills Instead - YouTube
来源:AI Engineer Code Summit 2025 (2025年11月21日) / The AI Engineer Podcast
演讲者:Barry Zhang (Product Lead, Anthropic) & Mahesh Murag (Engineering Lead, Anthropic)
原标题:Don't Build Agents, Build Skills Instead
1. 核心观点与主要论点
演讲者提出了 AI 开发范式的转变,认为当前的 AI 行业仍处于早期阶段(类比为“诺基亚时代”),开发者应该停止为每个细分领域重复造“全能 Agent”的轮子,转而构建通用的 Skills。
“AI 堆栈”的新类比:
模型 (Model) ≈ CPU:拥有巨大的潜力,但单独使用能力有限,只有少数巨头能制造。
Agent 运行时 (Agent Runtime) ≈ 操作系统 (OS):负责编排进程、资源和数据(如 Claude Desktop, OpenAI API)。
Skills ≈ 应用程序 (Apps):这是数百万开发者应该关注的层面,用于解决具体问题。
专业知识鸿沟 (The Expertise Gap):
Mahesh vs. Barry 比喻:演讲中用了一个生动的比喻——Mahesh 是一个智商 300 的数学天才(代表通用大模型),但他不懂税务法规;Barry 是一个经验丰富的税务专家(代表领域知识)。如果你要报税,你会选 Barry 而不是 Mahesh。
结论:目前的 Agent 虽然“聪明”(高智商),但缺乏特定领域的“专业知识”(Expertise)。Skills 的作用就是让通用的“天才”学会具体的“专业技能”。
通用 Agent + 专用 Skills:未来的方向是一个通用的、强大的 Agent(运行时),搭载各种领域特定的 Skills(如财务、法律、编程等),而不是为每个领域单独开发一个 Agent。
2. 关于构建 Skills 的具体方法和建议
演讲者强调,Skills 不仅仅是 Prompt,而是应该被视为软件来构建和维护。
结构化定义:一个成熟的 Skill 应该包含以下结构化组件,而不仅仅是一段长文本:
元数据 (Metadata):描述 Skill 的名称、版本、适用范围。
指令文档 (Instruction/Documentation):清晰定义操作步骤和规则。
脚本/工具 (Scripts/Tools):可执行的代码或 API 调用(通常通过 MCP 实现)。
示例 (Examples):Few-shot 示例,教模型如何处理特定情况。
工程化实践:
像软件一样对待:Skills 需要经过开发、测试、评估(Evaluation)和优化。
解耦:将“领域知识”与“智能推理”解耦。Skills 承载程序性知识(Procedural Knowledge),模型承载通用推理能力。
利用 MCP (Model Context Protocol):通过 MCP 服务器连接本地数据和工具,使 Skills 能够安全地访问外部系统。
参与者多元化:构建 Skills 的门槛比构建 Agent 低,非技术人员(如财务专家、法务顾问)也可以通过编写文档和规则来贡献 Skills。
3. 与构建 Agent 方式的对比分析
4. 视频中展示的典型案例或实际应用场景
视频中展示了 Anthropic 内部及合作伙伴如何利用 Skills 扩展 Claude 的能力:
Document Skills (文档处理):Anthropic 发布了专门用于创建和编辑专业 Office 文档的 Skills。这赋予了通用模型处理复杂格式文档的能力,而不需要重新训练模型。
行业垂直应用:
金融服务 (Financial Services):通过特定的 MCP Server 和 Skills,让 Claude 能够访问实时市场数据、执行合规检查。
生命科学 (Life Sciences):集成了特定领域的知识库和分析工具,辅助科研人员。
Claude Code:在 Claude Code 的开发中,团队发现让 Claude 自己创建和优化 Skill,可以实现能力的自我进化。例如,编写一个 Skill 来规范特定的代码风格或数据库操作流程。
5. 演讲者提供的参考资料或工具推荐
MCP (Model Context Protocol):一种开放标准,用于将 AI 助手连接到数据系统(如内容存储库、业务工具、开发环境)。它是构建 Skills 的重要基础设施。
Procedural Knowledge (程序性知识):关于“如何做某事”的知识,通常包含步骤、规则和策略,是 Skills 的核心内容。
Agent Skills Library:鼓励开发者建立组织内部的 Skills 库,让不同的 Agent 共享这些能力。