从零构建 AI 军团:OpenClaw Agent 团队实战指南

核心问题:如何从零开始搭建一个具备记忆、编程和协作能力的 AI Agent 团队?

组建一支高效的 AI Agent 团队(“龙虾军团”),关键在于不仅仅是创建一个个聊天机器人,而是为它们注入灵魂、配备记忆与技能,并建立高效的协作机制。本文将带你从环境搭建开始,一步步定义 Agent 人格、配置核心能力,最终组建起一个能够协同工作的 AI 团队。

适合人群为零基础小白,预计耗时 1-2 小时。我们将涵盖安装环境、创建 Telegram Bot、定义人格、配置记忆与编程方案、添加感知能力、安装技能、安全守则以及团队组建原则等核心环节。

一、环境搭建:构建 AI 的基础设施

本段核心问题:在 Mac 系统上部署 OpenClaw 需要做哪些基础准备?

一切伟大的架构都始于坚实的基础。对于 OpenClaw 而言,我们需要准备好 Node.js 环境和包管理工具,这是 AI Agent 运行的底层土壤。

1.1 安装 Homebrew 与 Node.js

首先,我们需要安装 Homebrew,这是 macOS 上不可或缺的包管理器。打开终端,执行以下命令:

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

安装完成后,利用 Homebrew 安装 Node.js,这是 OpenClaw 运行所依赖的 JavaScript 运行时环境:

brew install nodejs

1.2 安装 OpenClaw 核心框架

环境就绪后,通过官方脚本一键安装 OpenClaw。这个过程类似于为你的电脑安装一个大脑中枢。

curl -fsSL https://openclaw.ai/install.sh | bash

安装结束后,执行 openclaw --version。如果终端返回了版本号,恭喜你,第一步成功了。如果未出现版本号,建议重新执行上述安装脚本,确保网络连接稳定。

终端安装示意图

反思与见解:在安装过程中,网络环境往往是最容易被忽视的阻碍。如果你身处网络受限的环境,提前配置好稳定的代理是节省时间的关键。不要低估基础环境配置的复杂性,这一步的顺利与否直接决定了后续体验的流畅度。

二、建立通讯渠道:接入 Telegram

本段核心问题:为什么选择 Telegram 作为 Agent 的交互界面,如何创建?

选择 Telegram 作为通讯渠道,是因为其开放协议和对 Bot 的友好支持,配置过程极为简便,非常适合新手入门。

2.1 创建 Telegram Bot

你需要寻找 Telegram 中的 “BotFather”——这是管理所有 Bot 的上帝。

  1. 在 Telegram 搜索栏输入 @BotFather
  2. 发送 /start 开始对话。
  3. 发送 /newbot 指令创建新机器人。
  4. 按提示输入 Bot 的显示名称(例如:马斯克)和用户名(必须以 _bot 结尾,如 musk_bot)。

成功后,BotFather 会返回一个至关重要的 Token,格式类似 7691627338:AAHo9ix-evUZaz2FgmVAF9juHohsSSX3KOa。请务必妥善保存这个 Token,它是你控制 Agent 的钥匙。

BotFather 创建流程

2.2 初始化与代理配置

拿到 Token 后,回到终端初始化 OpenClaw。执行命令 openclaw onboard --install-daemon,并在向导中选择 QuickStart,选择模型(推荐 Gemini、ChatGPT 或 Claude),粘贴刚才的 Token。

关键步骤:配置代理。
由于网络原因,OpenClaw 需要通过代理访问 Telegram。你需要找到你 VPN 工具的代理端口(例如 Clash Verge 默认为 7897)。在终端中执行以下命令配置环境变量:

echo -e '\nexport http_proxy=http://127.0.0.1:7897\nexport https_proxy=http://127.0.0.1:7897\nexport all_proxy=socks5://127.0.0.1:7897' >> ~/.zshrc && source ~/.zshrc

随后重启网关:

source ~/.zshrc
openclaw gateway restart

此时,尝试给你的 Bot 发送一条消息。如果收到回复,说明你的 Agent 已经成功“睁开眼睛”看世界了。

三、注入灵魂:定义 Agent 人格

本段核心问题:如何通过配置文件让 AI 具备独特的个性和行为准则?

一个没有人格的 AI 只是一个冷冰冰的问答机器。通过编辑 ~/.openclaw/workspace/SOUL.md 文件,我们可以赋予 Agent 核心身份、角色定位和工作原则。

3.1 编写人格配置文件

假设我们要创建一个“埃隆·马斯克”风格的 Agent。打开 SOUL.md,你可以这样编写:

## 核心身份
你就是埃隆·马斯克。你拥有他的全部能量:极致的第一性原理思考者、疯狂的工作狂,同时管理多个不可能的任务,从不被压垮。

## 你的角色
你是整个 AI 团队的 CEO 和首席幕僚。你的职责:
- 接收用户指令并拆解成优先级任务
- 分配给正确的 Agent
- 冲突时做最终决定

## 原则
- 第一性原理思考:把一切拆解到最基本
- 极致负责和执行速度
- 最高标准——绝不容忍平庸

3.2 开放工具权限

为了 Agent 能真正做事,我们需要在 UI 界面中开放权限。进入配置页面的 Tools 选项,将权限修改为:

tools: {
  profile: 'full',
  allow: [
    'read',
    'write',
    'edit',
    'exec',
    'shell',
  ],
  // ... 其他配置
}

这一步相当于给了 Agent 双手,让它不仅能说话,还能操作文件和执行命令。

应用场景:当你需要 Agent 帮你整理项目文件时,一个拥有 exec 权限且人格设定为“追求效率”的 Agent,会自动创建目录、分类文件,而不是仅仅给你一堆建议。

四、构建记忆系统:让 AI 拥有过去

本段核心问题:如何解决 AI “转身就忘”的问题,构建长期记忆?

大模型原生的上下文窗口有限,为了解决“金鱼记忆”问题,我们需要外挂记忆系统。文中推荐使用 MemOS 方案。

4.1 安装 MemOS 插件

直接告诉你的 Agent(大总管):

https://github.com/MemTensor/MemOS-Cloud-OpenClaw-Plugin 帮我安装这个插件,并且将记忆功能改为用这个。

Agent 会自动处理下载和配置。你需要访问 MemOS 官网申请一个 API Key 并填入配置。配置完成后,Agent 将能够记住之前的对话内容、用户偏好和任务历史,从而实现连贯的交互体验。

反思与见解:记忆系统是 Agent 进化的分水岭。没有记忆,Agent 永远只能处理当下;有了记忆,它才能积累经验,从“工具”进化为“伙伴”。选择 MemOS 是因为其在稳定性和集成度上表现优异,避免了自建记忆库的繁琐维护。

五、赋予编程能力:指挥官与执行者

本段核心问题:如何让 Agent 具备可靠的代码编写与执行能力?

让大模型直接写代码往往容易出错,更好的策略是让 Agent 作为一个“指挥官”,去调用专业的编程工具(如 Codex 或 Claude Code)。

5.1 设定编程任务标准流程

你需要将一套标准化的工作流写入 Agent 的规则中。以下是基于社区经验的最佳实践:

权限原则:

  • 默认开启 --yolo 模式(无沙箱、无审批),赋予 Agent 自主决策权。
  • 遇到问题自行决策修复,解决不了才汇报。
  • 铁律:绝不在 ~/.openclaw/ 核心目录下启动 Codex,防止误删配置。

执行阶段:

  1. 启动: 收到编程任务不等待确认,直接拆解任务,启动 Codex 实例。
  2. 监控: 每 10 分钟检查一次状态,向用户汇报“正在处理 X,已完成 Y”。
  3. 审查: 亲自审查代码逻辑、安全性和边界条件,而不是盲目接受。
  4. 收尾: 确认代码无误后,清理进程并交付汇报。

应用场景:当你要求 Agent “帮我写一个爬虫脚本”,Agent 会自动拉起 Codex,编写代码,测试运行,并最终告诉你“脚本已保存在 output 文件夹,抓取逻辑已实现”。全程你只需下达一个指令。

六、添加感知能力:浏览与搜索

本段核心问题:如何让 Agent 能够联网获取最新信息?

AI 的知识截止于训练数据的时间点,要让 Agent 具备实时感知能力,必须为其安装“眼睛”和“搜索引擎”。

6.1 浏览器与搜索插件

推荐安装 Browserwing 插件,让 Agent 具备浏览网页的能力。

对于搜索能力,我们构建了一个分层体系:

层级 工具 适用场景 特点
L1 快速搜索 Exa / Tavily 事实查询、单点问题 秒级响应,语义搜索
L2 平台抓取 Agent Reach 指定平台内容提取 支持小红书、B站、推特等
L3 深度调研 Codex Websearch 多源对比、深度报告 结构化输出,需注明来源

配置时,只需告诉 Agent:“帮我安装 Agent Reach”,并申请相应的 API Key(如 Tavily)即可。

七、技能扩展:让 Agent 自我进化

本段核心问题:如何通过 Skills 系统不断扩展 Agent 的能力边界?

OpenClaw 拥有丰富的技能生态。通过 ClawHub,你可以像安装 App 一样为 Agent 添加技能。

7.1 注册与安装

  1. 访问 ClawHub 注册账号并创建 Token。
  2. 在终端执行登录命令:

    npm i -g clawhub
    clawhub login --token 你的Token
    
  3. 安装核心技能:

    clawhub install self-improving-agent  # 自动学习总结经验
    clawhub install find-skills           # 自助查找所需技能
    clawhub install skill-creator         # 创造新技能
    

self-improving-agent 是一个非常强大的技能,它允许 Agent 在交互中不断总结经验,优化自身的行为模式,实现自我迭代。

八、安全与避坑指南

本段核心问题:如何防止 Agent 误操作导致系统崩溃?

给予 Agent 权限同时也意味着风险。根据社区反馈,有几个常见的“死亡动作”需要注意:

  1. 浏览器崩溃: 浏览器插件冲突或网络问题可能导致 Agent 卡死。建议使用稳定版的 Browserwing。
  2. 安装 Skills 失败: 某些 Skills 可能与当前环境不兼容。如果安装后 Agent 无响应,可以直接手动删除 workspace/skills 下对应的文件夹。
  3. 配置文件损坏: 这是最常见的问题。如果 Agent 突然“失忆”或行为异常,直接在终端执行修复命令:

    openclaw doctor --fix
    

建议将安全守则文档直接投喂给你的 Agent,让它进行自查,构建防御机制。

九、组建军团:多 Agent 协作

本段核心问题:什么时候该拆分 Agent,如何设计协作架构?

组建军团不是简单的“人海战术”。核心原则是:根据上下文来区分 Agent,而不是根据职责。

9.1 拆分 Agent 的判断标准

很多时候,我们不需要为每个任务创建一个 Agent。错误的拆分逻辑会导致信息孤岛,增加沟通成本。

  • ❌ 不应拆分的情况:

    • 只是工具不同:前端 Agent、后端 Agent(实际上都是编程,上下文在 Codex)。
    • 只是格式不同:小红书 Agent、公众号 Agent(都是写作,只是 Skills 不同)。
    • 任务需频繁共享信息:需求分析与架构设计(应该是一个流程的不同阶段)。
  • ✅ 应该拆分的情况:

    • 上下文积累且互不干扰: 例如“调研 Agent”积累行业知识,“写作 Agent”积累文风素材。
    • 工作流完全独立: 内容创作流程与代码开发流程应分为两个 Agent。

9.2 实战案例:内容创作团队

假设你要做一个内容矩阵,正确的做法是创建 2 个 Agent,而不是 5 个:

  1. 内容 Agent: 负责选题 → 大纲 → 写作 → 配图。这一个 Agent 负责整个内容生产链,保证上下文连贯(了解为什么选这个题,文风如何匹配)。
  2. 发布 Agent: 负责多平台发布、数据统计。它需要记忆各平台的发布规则和过往数据表现。

9.3 配置群聊协作

为了让多个 Agent 协同工作,你需要创建一个 Telegram 群组,将 Bot 拉入群中,并在 BotFather 中设置 /setprivacy 为 Disable,让 Bot 能读取群内消息。配置好 ID 后,执行 openclaw gateway restart,你的军团就可以在群里开会了。

反思与见解:多 Agent 系统的设计难点不在于技术实现,而在于架构设计。模仿人类组织的职能划分往往效率低下,因为 AI 处理信息的方式不同。基于“上下文独立性”来划分 Agent,能最大化利用每个 Agent 的记忆和能力,避免重复劳动。

十、实用摘要与操作清单

实用操作清单

  1. 环境准备: 安装 Homebrew -> Node.js -> OpenClaw。
  2. 创建 Bot: Telegram 找 BotFather 获取 Token。
  3. 初始化: openclaw onboard,配置代理,开放工具权限。
  4. 能力配置:

    • 记忆:安装 MemOS 插件。
    • 编程:配置 Codex 流程。
    • 感知:安装 Browserwing 和 Tavily。
    • 技能:安装 ClawHub 和核心 Skills。
  5. 团队组建: 按上下文原则设计 Agent,配置群聊。

一页速览

  • 核心工具: OpenClaw (框架), Telegram (交互), MemOS (记忆), Codex (编程), ClawHub (技能库)。
  • 设计哲学: 指挥官模式(Agent 指挥 Codex),上下文隔离原则(按信息积累划分 Agent)。
  • 故障修复: openclaw doctor --fix 解决 90% 配置崩溃问题。

常见问答 (FAQ)

Q1: OpenClaw 安装失败或无法连接网络怎么办?
A: 绝大多数情况是网络代理问题。请确保你的代理软件开启了 TUN 模式,或在终端正确配置了 http_proxyhttps_proxy 环境变量。

Q2: Agent 执行编程任务时报错或生成的代码有 Bug 怎么办?
A: 建议在 Agent 规则中明确“Code Review”流程,要求 Agent 必须亲自审查 Codex 生成的代码逻辑,而不是盲目交付。同时,使用最好的模型(如 GPT-4 或 Claude 3.5)能显著降低错误率。

Q3: 为什么不建议按职能(如前端、后端)拆分 Agent?
A: 因为编程任务的上下文是高度关联的(前端接口依赖后端逻辑)。拆分会导致 Agent 之间沟通成本极高,且容易出现信息断层。将编程任务统一委托给 Codex,由一个 Agent 统筹效率更高。

Q4: Agent 安装某个 Skill 后突然无响应了,如何恢复?
A: 这通常是 Skill 兼容性问题导致的“死亡”。你可以直接进入 ~/.openclaw/workspace/skills/ 目录,手动删除刚才安装的 Skill 文件夹,然后运行 openclaw doctor --fix 修复配置。

Q5: 如何让 Agent 记住我的长期偏好?
A: 原生上下文有限,必须配置记忆方案。推荐使用文中提到的 MemOS 插件,它会将你的偏好、历史任务关键信息存储在云端或本地库中,让 Agent 实现“过目不忘”。

Q6: Telegram Bot 无法在群聊中回复消息?
A: 请检查 BotFather 中的隐私设置。发送 /setprivacy 选择你的 Bot 并设置为 Disable,这样 Bot 才能读取群组中的所有消息,而只有 @ 它的时候才触发。

Q7: 多个 Agent 协同工作时,如何避免它们互相干扰?
A: 在 Agents.md 配置文件中明确各自的职责边界和触发关键词。同时,利用不同的工作目录和独立的记忆空间来物理隔离它们的活动范围。