Anthropic核心洞察:放弃重复构建Agent,聚焦Skills打造专业能力

在AI Agent的研发与落地过程中,很多团队都陷入过一个误区:为每个业务场景从零构建专属Agent,搭配独立的工具链和脚手架。但Anthropic的Barry和Mahesh在3个月前的内部分享中,抛出了一个颠覆式的核心观点——与其为每个场景再造新Agent,不如给现有通用Agent装上“Skills”。这一观点并非凭空提出,而是源于Claude Code的实战经验、Skills生态上线5周的真实数据,以及对Agent架构终局的深度预判。今天,我们就拆解这一观点背后的逻辑,看看Skills如何重新定义Agent的能力构建方式。

一、从Claude Code实践反思:通用Agent≠专业能力

很多研发团队最初对AI Agent的认知是:不同领域的Agent必然“形态各异”,每个Agent都需要配套专属的工具链和脚手架——毕竟金融、科研、办公等场景的需求差异巨大。Anthropic团队在开发Claude Code时,也曾持有这样的假设,但实战结果却推翻了这一认知。

1. 最初的假设与现实的反差

Claude Code本质上是一款通用Agent,在处理“生成财务报告”这类典型任务时,其核心操作逻辑高度统一:调用API拉取数据→通过文件系统整理数据→运行Python脚本分析→输出标准化文档。整个过程的底层支撑仅需bash和文件系统,核心脚手架可以做到极致精简。这意味着,不同领域的Agent并非需要完全独立的底层架构,通用Agent的基础框架足以支撑多场景需求。

2. 核心类比:高智商天才≠专业专家

为了说明通用Agent的核心短板,Anthropic团队用了一个非常形象的类比:当你需要报税时,你会选择智商300的数学天才,还是经验丰富的税务专家?答案显然是后者。没有人会希望这位高智商天才从头推导2025年的税法规则——即便他有能力做到,也会耗费大量时间,且无法保证符合实操中的专业规范。

当前市面上的大多数Agent,就像这位“高智商天才”:它们拥有极强的通用推理能力,只要给予足够的引导,能做出令人惊艳的成果,但核心痛点也十分突出:

  • 缺少特定领域的关键上下文,难以直接匹配专业场景需求;
  • 无法从历史任务中学习复用经验,重复造轮子的问题普遍存在。

3. 现有Agent的核心痛点

总结来看,仅依靠通用能力的Agent在落地时会面临两个核心问题:

  • 专业经验缺失:即便逻辑能力再强,也无法替代长期沉淀的领域实操经验;
  • 无持续学习能力:完成一次任务后,相关的程序性知识无法留存,下次遇到同类问题仍需重新推导。

这也是Anthropic转向Skills构建的核心原因——要给通用Agent补上“专业经验”这一课。

二、Skills的极简设计:本质是可复用的“专业知识文件夹”

既然通用Agent缺少的是专业经验和可复用的程序性知识,那么Skills就是为解决这一问题而生的方案。Anthropic对Skills的设计思路,核心是“极简”——这种简单并非偶然,而是刻意为之。

图像

1. Skills的核心定义:打包程序性知识的文件集合

简单来说,Skills就是“打包了可组合程序性知识的文件集合”——说白了就是一个文件夹。这个定义看似简单,却精准抓住了“可复用”的核心需求:把某一领域、某一任务的专业操作流程、工具脚本、参考文档等,都归集到一个文件夹中,形成可复用的“专业知识包”。

2. 极简设计的初衷:人人可创建、可共享、可管理

Anthropic之所以将Skills设计得如此简单,核心目标是降低使用门槛:任何人(无论是人类还是Agent),只要有一台电脑,就能创建和使用Skills。这一设计带来了三大便利:

  • 版本管理:可以用Git对Skills进行版本控制,追踪每一次的修改和迭代;
  • 便捷共享:可上传至Google Drive共享,或打包成zip文件发送给团队成员;
  • 低门槛创建:无需复杂的开发环境,普通用户也能上手。

3. 脚本化工具:解决传统MCP工具的三大硬伤

在Skills的文件夹中,还可以存放脚本作为专属工具——这一设计直接解决了传统MCP工具的三大核心问题。我们先对比传统MCP工具和Skills中脚本工具的差异:

特性 传统MCP工具 Skills中的脚本工具
指令模糊时的表现 模型易产生理解偏差,执行出错 代码本身就是文档,逻辑清晰,减少偏差
工具可修改性 模型无法修改工具本身 脚本可被模型直接修改,适配不同场景
上下文窗口占用 工具始终占用上下文窗口,挤占空间 按需从文件系统加载,不常驻上下文

传统MCP工具的问题,本质上是“静态、不灵活、高占用”,而脚本化的工具则实现了“动态、可定制、低占用”。

4. 实际案例:幻灯片样式Python脚本的复用

Anthropic团队举了一个非常贴近实操的例子:Claude在处理幻灯片制作任务时,需要反复编写同一段用于添加幻灯片样式的Python脚本。每次重新编写不仅效率低,还容易出现格式不一致的问题。

解决方案很简单:让Claude把这段脚本存进Skill目录中。后续再处理同类任务时,Claude无需重新编写,直接调用该脚本即可。这一调整让任务执行的一致性和效率都得到了显著提升——这正是Skills“可复用”价值的直观体现。

三、渐进式加载:破解上下文窗口容量的核心方案

一个成熟的Agent可能需要适配数百个不同的Skills,如果把所有Skills的内容都直接塞进模型的上下文窗口,显然不现实——上下文窗口的容量有限,大量无关内容的涌入只会挤占核心信息的空间。对此,Anthropic给出的解决方案是“渐进式加载(Progressive Disclosure)”。

图像

1. 多Skills加载的核心痛点:上下文窗口资源紧张

AI模型的上下文窗口就像电脑的内存——容量有限,需要优先存放当前最核心的信息。如果一个Agent配置了上百个Skills,每个Skills都包含详细的指令、脚本、参考文档,全部加载会导致两个问题:

  • 核心任务的上下文被挤占,模型注意力分散;
  • 大量无关信息增加模型处理成本,降低执行效率。

2. 渐进式加载的核心逻辑:先元数据,再按需加载

渐进式加载的思路可以拆解为两个步骤:

  1. 运行时仅加载Skills元数据:模型首先只获取每个Skill的基础信息,包括名称和简要描述,了解每个Skill的核心用途;
  2. 按需加载完整内容:当Agent根据任务判断需要使用某个Skill时,再从文件系统中读取该Skill的完整指令文件(如skill.md),其他参考资料和脚本也仅在需要时访问。

3. 渐进式加载的核心价值:无限扩展Skills数量

这一设计的关键价值在于,Skills的数量理论上可以无限扩展——因为模型不会一次性加载所有Skills的完整内容,仅需维护一份轻量化的元数据列表。这意味着,Agent可以适配成千上万个不同领域的Skills,却不会因为上下文窗口容量问题影响核心任务的执行。

四、Skills生态的5周增长:三类核心场景落地

Skills上线仅5周,其生态的增长速度就超出了Anthropic的预期。这一阶段的生态增长,主要集中在三类核心场景,覆盖了通用能力拓展、第三方产品集成、企业内部落地等维度。

图像

1. 基础能力型:拓展通用Agent的核心基础功能

基础能力型Skills的核心目标,是为通用Agent补充全新的通用能力,让Agent能处理更多基础任务:

  • Anthropic自研案例:文档处理Skills,让Claude具备创建和编辑专业级Office文档的能力,无需额外开发专属Agent;
  • 第三方案例:Cadence开发的科研Skills,让Claude能完成EHR(电子健康记录)数据分析和生物信息学相关任务,拓展了科研领域的基础处理能力。

2. 产品集成型:对接第三方产品的专属能力

这类Skills聚焦于让Agent更好地适配和使用第三方产品,打通Agent与外部工具的协作链路:

  • BrowserBase案例:开发StageHand技能,让Claude能自动化完成浏览器操作,比如批量处理网页数据、模拟用户交互等;
  • Notion案例:定制专属Skills,帮助Claude深入理解用户的Notion工作区结构,精准提取、整理Notion中的数据,适配Notion的使用逻辑。

3. 企业内部型:增长最快的Skills落地场景

企业内部型Skills是5周内增长最快的类别,核心是将企业的内部知识和规范沉淀为可复用的Skills:

  • 组织最佳实践:将企业在财务、招聘、法务等领域的最佳实践打包成Skills,让Agent按照企业规范处理相关任务;
  • 内部软件使用:梳理内部自研软件的使用方法,形成Skills后,Agent能快速掌握软件操作逻辑,降低员工培训成本;
  • 代码规范统一:面向上万规模的开发者团队,通过Skills统一代码风格和工程规范,提升团队协作效率。

4. 关键趋势:非技术人员也能构建专属Skills

Skills生态增长中最值得关注的趋势是:非技术人员开始成为Skills的构建者。财务、招聘、法务、会计等岗位的从业者,即便不具备代码编写能力,也能通过Skills将通用Agent改造成符合自身工作需求的专属工具。

这一趋势的背后,正是Skills极简设计的价值——无需复杂的开发能力,只需梳理自身的专业流程和知识,就能创建可复用的Skills,让通用Agent具备行业专属的专业能力。

五、Skills + MCP:互补而非竞争,构建完整Agent能力架构

很多人会疑惑:Skills生态的崛起,是否会替代传统的MCP工具?Anthropic的实践给出了答案:Skills和MCP并非竞争关系,而是互补关系,二者结合才能构建完整的Agent能力架构。

1. MCP的核心价值:连接Agent与外部世界

MCP(Model Contextual Protocol)工具的核心作用,是为Agent搭建与外部世界的连接桥梁,具体包括:

  • 对接外部API:调用第三方平台的接口获取数据或执行操作;
  • 访问数据库:读取企业内部或外部的结构化数据;
  • 集成第三方服务:如支付、存储、协作工具等。

简单来说,MCP解决的是“Agent如何触达外部资源”的问题,是Agent与外部环境交互的“通道”。

2. Skills的核心价值:沉淀专业知识与流程

Skills则聚焦于“Agent如何使用外部资源”的问题——它沉淀的是领域内的专业知识、操作流程和复用脚本。开发者在构建Skills时,往往会编排多个MCP工具,将其串联成符合业务逻辑的复杂工作流。

比如,一个“财务报表自动生成”的Skill,会整合多个MCP工具:调用财务系统API拉取原始数据(MCP)→用Python脚本清洗分析数据(Skills内的脚本)→调用文档工具API生成Excel报表(MCP)→用格式脚本统一报表样式(Skills内的脚本)。

3. 收敛的架构模式:四大组件构成Agent能力核心

随着Skills和MCP的结合落地,Agent的架构正在收敛为一套清晰的模式:

  1. Agent循环:核心负责上下文的管理,判断任务需求,决策需要调用的Skills和MCP工具;
  2. 运行时环境:提供文件系统和代码执行能力,支撑Skills的存储和脚本运行;
  3. MCP服务器:作为外部连接的核心,对接API、数据库、第三方服务;
  4. Skills库:按需加载的专业能力集合,沉淀领域知识和操作流程。

4. 落地案例:Anthropic的垂直领域方案

Skills与MCP的结合,让Agent快速拓展到新领域成为可能。Anthropic在Skills上线后,迅速推出了金融服务和生命科学两大垂直领域的Agent方案——核心逻辑就是为通用Agent配置对应领域的MCP服务器和专属Skills,无需从零构建新的Agent架构。

这一模式验证了Skills+MCP组合的价值:仅需调整Skills和MCP配置,就能让通用Agent具备垂直领域的专业能力,大幅降低Agent的场景拓展成本。

六、未来方向:像管理软件一样管理复杂Skills

随着Skills的应用越来越广泛,其形态也从简单的markdown文件,逐渐演变为包含可执行文件、脚本、资产的完整包。对此,Anthropic提出了未来Skills管理的三大核心方向,核心思路是:像对待软件一样对待Skills

图像

1. 测试与评估:保障Skills使用的准确性

Skills的核心价值是“复用”,但复用的前提是“准确”。未来需要建立完善的Skills测试与评估体系:

  • 场景测试:验证Agent在不同任务场景下,能否正确选择并加载对应的Skill;
  • 输出评估:检查使用Skill后,Agent的输出质量是否符合预期;
  • 异常处理:测试Skill在脚本出错、资源缺失等异常情况下的表现。

2. 版本管理:追踪Skills演变对Agent行为的影响

Skills会随着业务需求的变化不断迭代,这就需要完善的版本管理机制:

  • 版本记录:记录每个Skills版本的修改内容、更新时间、责任人;
  • 行为追踪:分析Skills版本变化对Agent执行任务的影响,避免版本迭代导致的行为异常;
  • 回滚机制:当新版本Skills出现问题时,能快速回滚到稳定版本。

3. 依赖声明:提升Agent跨环境行为的可预测性

随着Skills之间的互相引用越来越频繁,以及Skills对MCP服务器、环境包的依赖增加,“依赖声明”变得至关重要:

  • 内部依赖:声明Skills之间的引用关系,确保加载顺序和依赖完整性;
  • 外部依赖:声明Skills所需的MCP服务器地址、环境包版本等信息;
  • 环境适配:让Agent在不同的运行环境中,能根据依赖声明自动适配,保证行为一致性。

七、处理器-操作系统-应用:Agent架构的终局类比

Anthropic用一个形象的类比,总结了模型、Agent Runtime和Skills三者的关系,也清晰描绘了Agent架构的终局方向:

1. 模型:如同计算机的处理器

AI模型(如Claude)就像计算机的处理器——它需要巨额的研发和算力投资,蕴含着巨大的潜力,但单独拿出来几乎没有实际用处。处理器的价值,需要通过操作系统和应用才能释放;同理,模型的能力,也需要Agent Runtime和Skills的支撑才能落地。

2. Agent Runtime:如同计算机的操作系统

Agent Runtime(Agent运行时环境)就像操作系统——它负责编排模型周围的进程、资源和数据,把正确的信息(token)送进送出模型,让模型的算力和推理能力得到有效利用。当前行业的核心探索方向之一,就是构建最高效的Agent Runtime抽象层,最大化模型的价值。

3. Skills:如同计算机的应用程序

Skills则像计算机的应用程序——少数企业有能力研发处理器(模型)和操作系统(Agent Runtime),但全世界数百万的开发者和从业者,都可以参与到“应用程序(Skills)”的构建中。

软件的价值在于编码了领域专业知识和独特视角,Skills的核心价值也正在于此:它让每个领域的从业者,都能把自己的专业知识沉淀为可复用的“应用”,赋予通用Agent专属的专业能力。

4. 核心目标:让Agent在持续使用中越变越强

Anthropic的最终目标是:和用户协作30天后的Claude,要比第一天的Claude强得多。这种能力提升,并非依赖模型本身的版本升级,而是依靠Skills的持续积累——Claude今天创建的Skills,未来的Claude可以高效复用,让“记忆”变得具体且可迁移。

当Claude能够自主创建和迭代Skills时,整个Agent系统就会进入自循环的正向增长:使用越多,沉淀的Skills越多,专业能力越强,形成“使用-沉淀-复用-提升”的闭环。

FAQ:关于Agent Skills的核心问题解答

1. 什么是Agent Skills?

Agent Skills是Anthropic提出的概念,本质是打包了可组合程序性知识的文件集合(通俗来说就是一个文件夹),用于给通用Agent补充专业的程序性知识和可复用的脚本工具,让Agent具备领域专属的专业能力。

2. Skills和传统MCP工具有什么本质区别?

传统MCP工具是Agent与外部交互的“通道”,解决的是“如何连接外部资源”的问题,且存在指令模糊易出错、无法修改、常驻上下文窗口的问题;Skills则是“专业知识包”,解决的是“如何使用外部资源”的问题,其内置的脚本工具可修改、按需加载,代码本身还能作为文档提升执行一致性。

3. 渐进式加载为什么能解决上下文窗口不够用的问题?

渐进式加载的核心是“按需加载”:运行时仅让模型获取Skills的元数据(名称+简要描述),不占用过多上下文空间;仅当Agent确定使用某个Skill时,才加载其完整内容。这让Skills数量可以无限扩展,而不会挤爆上下文窗口。

4. 非技术人员也能创建Skills吗?

可以。Skills的极简设计就是为了降低创建门槛,非技术人员(如财务、法务、招聘从业者)无需编写代码,只需梳理自身的专业流程和知识,将其整理成文件集合,就能创建符合自身需求的Skills。

5. Skills和MCP如何配合提升Agent的能力?

MCP负责搭建Agent与外部世界的连接(如API、数据库、第三方服务),Skills负责沉淀使用这些外部资源的专业知识和流程。开发者可在Skills中编排多个MCP工具,形成复杂的业务工作流,让Agent既能够触达外部资源,又能专业地使用这些资源完成任务。

6. 为什么说Skills能让Agent“越用越强”?

Skills让Agent的“记忆”变得具体且可迁移——Agent在处理任务时创建的Skills(如脚本、流程文档),后续可直接复用,无需重复推导。随着使用时间的增加,Agent积累的Skills越来越多,专业能力也会持续提升,这一过程无需依赖模型本身的升级。

总结

Anthropic的这一内部分享,核心是为AI Agent的研发和落地提供了一条更高效的路径:放弃低效率的“场景化Agent重复构建”,转向“通用Agent+Skills”的模式。Skills的极简设计、渐进式加载、与MCP的互补结合,以及生态的快速增长,都验证了这一模式的可行性。

未来,随着Skills管理体系的完善(测试评估、版本管理、依赖声明),以及非技术人员的广泛参与,Skills将成为连接通用AI模型与各领域专业能力的核心桥梁,让AI Agent真正从“高智商但无经验”的状态,转变为“既聪明又专业”的专属工具。