Claude Managed Agents 深度解析:Anthropic 的云端智能体服务会如何改变企业自动化?

最近,Anthropic 发布了一个叫 Claude Managed Agents 的新产品。简单来说,你告诉 Anthropic 你想要什么样的 AI 智能体,它就在云端帮你运行起来,基础设施全部由它提供,你只需要按使用量付费。

这个消息在开发者圈子里引起了不少讨论。有人说,这可能会让一批做 AI 智能体基础设施的创业团队面临挑战。与此同时,Anthropic 的年经常性收入刚刚突破 300 亿美元,是去年 12 月的三倍,大部分增长来自企业客户。华尔街已经开始紧张,《华尔街日报》提到,投资者对传统 SaaS 公司的股价越来越谨慎,担心这类产品会让一些已有的软件服务变得多余。

那么,这个产品到底是什么?和开发者已经熟悉的 Claude Code 有什么区别?技术上又是怎么实现的?我们一起来看看。

什么是 Claude Managed Agents?和 Claude Code 有什么不同?

如果你用过 Claude Code,应该知道 AI 智能体是怎么工作的:你给它一个任务,它会自己规划步骤、调用工具、写代码、改文件,一步步把事情做完。

区别在于运行环境。Claude Code 跑在你自己的电脑上,是一个给开发者个人使用的命令行工具。你关上电脑,它就停了。

而 Managed Agents 跑在 Anthropic 的云上,是一个给企业使用的 API 服务。它可以 24 小时不间断运行,即使网络断开也不会丢失进度。你的产品可以直接内嵌智能体能力。例如 Notion 就是这么做的:用户在 Notion 里把任务分配给 Claude 智能体,智能体在后台完成工作后把结果交回来,用户全程不需要离开 Notion。

Notion 集成示例

下面这个表格可以帮你快速看清两者的区别:

特性 Claude Code Claude Managed Agents
运行环境 本地电脑 Anthropic 云端
目标用户 个人开发者 企业及产品团队
运行方式 命令行工具 API 服务
持续运行 依赖本地设备在线 7×24 小时不间断,断线恢复
典型场景 个人编程辅助 产品内嵌、团队协作、自动化流程

几种典型的使用方式

  • 「事件触发型」:系统发现 bug,自动派出智能体修复并提交合并请求,整个过程不需要人工介入。
  • 「定时型」:每天早上自动生成 GitHub 活动摘要或者团队工作简报。
  • 「即发即忘型」:在 Slack 里给智能体派一个任务,它完成后把表格、演示文稿或者应用程序交回来。
  • 「长时间任务型」:跑几个小时的深度研究或者代码重构。

为什么企业需要它?自己搭建不行吗?

自己搭建当然可以,但代价很高,速度也很慢。

一个能真正上线的智能体,需要的远远不止“调一下 API”那么简单。你需要准备:

  • 「沙盒环境」:一个隔离的安全空间,AI 在里面运行代码、修改文件,无论怎么操作都不会影响外部真实系统。
  • 「凭证管理」:安全地存储和调用各种访问密钥。
  • 「状态恢复」:当任务中断时能够从中断点继续。
  • 「权限控制」:精细管理 AI 能做什么、不能做什么。
  • 「全链路追踪」:记录每一步操作,方便调试和审计。

很多企业客户之前需要一整个工程师团队专门处理这些事情。现在这些功能开箱即用,工程师可以专注于产品真正核心的部分。

不过,Managed Agents 解决的痛点还不只是节省人力。有一个很精辟的总结:本地自己搭建的调度框架往往是徒劳的,因为随着模型迭代,原本针对旧模型局限而精心设计的框架,可能会失去存在的意义。模型的局限性,厂家自己最清楚。它可以完全按照模型的特性设计不同的调度框架,然后打包卖给你。这个包,就是 Managed Agents。

Anthropic 的工程博客里有一个具体例子:Claude Sonnet 4.5 在接近上下文窗口极限时会变得“焦虑”,草草结束任务。于是他们在调度框架里加入了上下文重置来应对。但到了 Claude Opus 4.5,这个问题消失了,之前的补丁反而成了累赘。如果你自己搭建调度框架,每次模型升级你都得跟着修改。交给 Anthropic,他们会替你优化——严格来说,他们优化的就是卖给你的服务。

架构演进图

谁已经在用了?具体怎么用的?

Notion

Notion 允许用户在工作区里直接把编码、做演示文稿、整理表格这些任务交给 Claude。几十个任务可以并行运行,整个团队可以在同一个输出上协作。Notion 的产品经理说,用户可以把开放式的复杂任务直接委托出去,而不用离开 Notion。

Sentry

Sentry 做了一个“从发现 bug 到提交修复代码”的全自动流程。他们的人工智能调试工具找到问题根因后,Claude 直接写补丁、开启合并请求。工程总监说,几周就上线了,还省掉了持续维护自建基础设施的运营开销。

Atlassian

Atlassian 把 Managed Agents 接进了 Jira,开发者可以直接在 Jira 里面把任务分配给 Claude 智能体。

Asana

Asana 做了“人工智能同事”,在项目管理里加入人工智能协作者,能够接收任务并交付成果。

General Legal

这是一家法律科技公司,他们的玩法最有趣:智能体可以根据用户的提问,临时编写工具来查询数据。以前每个用户的问题都需要提前预判并开发专门的检索工具,现在智能体自己按需生成。技术负责人说开发时间缩短了 10 倍。

Rakuten

Rakuten 在工程、产品、销售、市场、财务各个部门都部署了专项智能体,每个都在一周内上线。这些智能体通过 Slack 和 Teams 接收任务,交回来的是表格、演示文稿、应用程序这些实际可用的成果。

技术原理:大脑和手分开

Anthropic 的工程团队写了一篇技术博客,讲述了 Managed Agents 背后的架构演进。

最早,他们把所有的东西都塞进一个容器里:人工智能的推理循环、代码执行环境、会话记录,全在一起。好处是简单,坏处是鸡蛋全在一个篮子里——容器一旦出问题,整个会话就丢失了,而且没法单独替换某个部分。

后来他们做了一个关键的拆分:

大脑和手分离示意图
  • 「“大脑”」:Claude 和它的调度框架,负责思考和决策。
  • 「“手”」:沙盒和各种工具,负责执行具体操作。
  • 「“记忆”」:独立的会话日志,记录发生的一切。

这三者互不依赖,任何一个出了问题都不会影响其他两个。

这个拆分带来的实际好处

更快

不是每个任务都需要启动完整的沙盒环境。现在,只有人工智能真的需要运行代码时,才会按需启动。首次响应的延迟中位数降低了大约 60%,极端情况降低了超过 90%。

更安全

人工智能生成的代码运行在沙盒里,而访问外部系统的凭证存放在沙盒外面的安全保险箱里,两边物理隔离。举个例子:访问 Git 仓库时,系统初始化的时候就把代码克隆好了,人工智能可以正常使用 git push 和 git pull,但访问令牌本身对人工智能是不可见的。对于 Slack、Jira 这类服务,通过 MCP 协议接入,请求经过代理层,代理层去保险箱取出凭证来调用服务,人工智能全程接触不到凭证。

安全隔离示意图

更灵活

大脑不关心“手”具体是什么。工程博客里有句话很有意思:调度框架不知道沙盒到底是一个容器、一部手机、还是一个宝可梦模拟器。只要符合“名字和输入进去,字符串出来”这个接口就行。这也意味着多个大脑可以共享同一双手,一个大脑也可以把手交给另一个大脑,为多智能体协作打下了基础。

使用成本是多少?

定价包含两个部分:

  • 「Token 费用」:按照 Anthropic API 的标准价格收取。
  • 「运行时费用」:0.08 美元/会话小时,空闲时不收费。
  • 「网页搜索功能」:10 美元/千次。

需要注意,0.08 美元一小时听起来不多,但如果智能体跑几个小时的复杂任务,加上 Token 消耗,总成本可能会比较可观。企业需要提前做好预算评估。

它有什么局限性?

Managed Agents 并不是万能的,有几点需要留意。

部分功能还在预览阶段

多智能体协作、高级记忆工具、自我评估迭代(让智能体自己判断任务完成质量并反复改进)这些能力目前还没有全面开放,需要申请才能使用。

平台绑定

选择 Managed Agents 意味着你的智能体基础设施绑定在了 Anthropic 的生态里。如果未来想换模型或者换平台,迁移成本不可忽视。

上下文管理仍然是难题

虽然会话日志独立存储,但长时间任务中哪些信息该保留、哪些该丢弃,仍然涉及不可逆的决策。这是一个持续的挑战。Anthropic 目前的做法是把上下文存储和上下文管理分开:存储保证信息不丢失,管理策略随模型进化而调整。

成本可预测性

正如上面提到的,长时间运行的复杂任务成本可能不低。按会话小时计费的模式需要企业仔细评估任务类型和运行时长。

如何开始使用?

如果你是企业开发者,想在自家产品里嵌入人工智能智能体的能力,Managed Agents 可能会帮你省掉几个月的基础设施工作。

目前支持六种语言的软件开发工具包:Python、TypeScript、Java、Go、Ruby、PHP。

如果你已经在使用 Claude Code,更新到最新版,然后输入 /claude-api managed-agents-onboarding 就可以开始。

常见问题解答

「问:一个智能体会话可以运行多长时间?」

理论上可以持续运行很长时间,因为系统设计支持断线恢复和状态保持。具体时长取决于任务复杂度和上下文管理策略。

「问:空闲时真的不收费吗?」

是的。只有会话处于活跃状态(即智能体正在工作或等待响应)时才按小时计费。空闲等待期间不计费。

「问:智能体能访问我公司的内部系统吗?」

可以,但需要通过安全的凭证管理机制。人工智能本身不会直接接触任何密钥或令牌,所有外部访问都经过代理层处理。

「问:多个智能体能协作完成一个任务吗?」

这个功能目前处于研究预览阶段,尚未全面开放。架构上已经为多智能体协作打下了基础,但正式使用需要申请。

「问:如果模型升级了,我的智能体会自动受益吗?」

会的。因为调度框架由 Anthropic 维护,他们会根据新模型的特性优化框架。你不需要自己修改任何代码。

「问:我能把智能体部署在自己公司的云环境里吗?」

Managed Agents 是托管在 Anthropic 云上的服务。如果你有合规或数据主权方面的特殊要求,可能需要评估是否适合。

人工智能智能体基础设施的“AWS 时刻”

看起来 Managed Agents 走的是 AWS 当年的老路:先有了计算能力,然后把运行环境也打包了。十年前企业纠结“上不上云”,现在纠结“智能体基础设施自建还是托管”。历史经验告诉我们,大多数企业最终会选择托管,因为基础设施从来不是核心竞争力。OpenAI 也推出了自己的智能体平台 Frontier,这个赛道的竞争刚刚开始。

从技术角度看,“大脑和手分离”这个架构思路值得关注。它让系统的每个部分都可以独立演进:模型升级了,换大脑;需要新工具,加一双手;存储方案改了,替换记忆层。工程博客里有一个很好的类比:操作系统的 read() 命令不关心底下是 1970 年代的磁盘还是现代固态硬盘,抽象层稳定了,底层的实现可以随便换。

从使用角度看,如果你是企业开发者,想在自己的产品里嵌入人工智能智能体的能力,Managed Agents 可能会省掉你几个月的基础设施工作。如果你已经是 Claude Code 的用户,更新到最新版就能开始体验。如果你是普通用户,短期内最直观的感受可能是:你用的那些软件即服务产品里,会有越来越多的人工智能智能体在后台帮你干活,而这些智能体很可能就跑在 Managed Agents 上。

至于人工智能智能体的基础设施最终会不会像云计算一样被几家大厂垄断,这个问题现在还没有定论。但有一点是确定的:基础设施的门槛降低了,但怎么定义好的任务、怎么设计好的工作流、怎么建立信任让人工智能接触核心业务数据,这些问题 Managed Agents 帮不了你。这些仍然是每个企业需要自己思考和解决的问题。