OpenClaw 保姆级教学:从基础安装到让 Agent 成为数字员工的完整指南
本文欲回答的核心问题:OpenClaw 到底是什么,以及如何一步步从安装配置到中级记忆优化,再到高级自主能力,让它真正成为随时可用、不会遗忘、能独立负责项目的本地 AI 数字员工?
OpenClaw 本质上是一个本地运行的 AI 网关。它让你的电脑上运行一个 Gateway 进程,这个进程连接聊天软件(如 Telegram、Discord),再连接 AI 模型(如 Claude、GPT),从而让你在任何聊天工具里直接和 AI 对话,所有记忆和配置都只存放在本地 ~/.openclaw/ 目录,不存在隐私泄露风险。
为什么需要这样的设计?大多数 AI 服务没有直接提供聊天机器人接口,你要么用网页版,要么用 App,而 OpenClaw 把整个流程缩短成“在 Telegram 发一条消息”就完成。基础篇解决“能用”,中级篇解决“好用”,高级篇解决“自主干活”。下面我们按顺序展开,每一步都基于实际操作流程,确保你跟着走就能落地。
基础篇:如何安装和配置 OpenClaw,让它立刻在聊天软件里可用?
本小节欲回答的核心问题:OpenClaw 的安装和配置流程是什么?新手如何避免常见卡点,让它 30 分钟内就能在 Telegram 上和 AI 对话?
OpenClaw 的安装分为硬件准备、模型 API 准备、翻墙环境、正式安装、配置向导、第三方模型配置、网络代理和安全设置几个阶段。
首先是硬件与系统要求。Mac 用户最省心,直接原生支持;Windows 用户必须安装 WSL2 并推荐 Ubuntu 22.04;Linux 用户直接运行即可。如果你想 24 小时挂机,推荐 Mac Mini 或云服务器 VPS(如 DigitalOcean 每月 12 美元起)。
大模型 API 准备是关键。推荐方案对比:ChatGPT Plus(20 美元/月,最省心)、阿里云百炼 Coding Plan(100-200 元/月,国内稳定)、OpenRouter(按量付费)、AI/ML API(官方集成伙伴)。新手先用 OpenRouter 或 AI/ML API 按量付费,避免一开始就踩中转站的不稳定坑。
翻墙环境必备。Telegram 和 Discord 需要代理,使用 Clash Verge 等工具,开启 TUN 模式。验证方法:在终端运行 curl -I https://api.telegram.org,如果返回 200 就说明终端能访问。
正式安装步骤如下:
-
安装 Homebrew 和 Node.js(Node.js 版本必须 ≥22):
验证:node –version 和 npm –version。
-
安装 OpenClaw:
安装后运行 openclaw –version 确认。
-
启动配置向导:
–install-daemon 参数让它后台持续运行,重启电脑自动启动。
配置流程中,选择 AI 模型提供商时,如果用第三方 API 选 Skip;选择聊天平台推荐 Telegram(配置 3 分钟,支持长消息和文件)。创建 Telegram Bot 的步骤:在 BotFather 发送 /newbot,输入名称和用户名(必须以 _bot 结尾),复制返回的 Token 粘贴到终端。
第三方模型配置推荐用 Web UI:打开 http://127.0.0.1:18789,进入 Settings → Models → Add Provider,填入 Base URL、API Key 和 Model ID。或者直接编辑 ~/.openclaw/openclaw.json 中的 models.providers 部分,例如添加 openrouter 配置。
网络代理配置是很多人卡住的地方。确认 Clash 的 HTTP 端口(通常 7890)和 SOCKS5 端口(7891),在 ~/.zshrc 或 ~/.bashrc 添加:
source 重新加载后运行 openclaw restart。
安全配置必须做:限制 API 每日预算、开启工具 approvalRequired(执行命令前确认)、不要把 Gateway 监听改成 0.0.0.0。
常见问题排查:
-
☾ Bot 不回消息:用 openclaw status、openclaw logs –tail 50 检查。 -
☾ 端口占用:lsof -i :18789 后 kill -9 。 -
☾ Telegram 配对失败:openclaw pairing approve telegram 。
作者反思:我在第一次配置代理时,忘记开启 TUN 模式,导致终端 curl 一直失败,花了整整 40 分钟才发现。这个教训让我后来每次装新工具都先验证终端代理,这条铁律现在写进了我的 SOUL.md 里。
(此处插入基础篇原配图)
通过以上步骤,你就能在 Telegram 里直接发消息调用 AI,成本最低约 30 元/月(Ollama + 本机),性价比方案约 150 元/月。
中级篇:如何搭建记忆体系、搜索决策树和计划文件,让 Agent 从“能用”变成“好用”?
本小节欲回答的核心问题:为什么新装的 OpenClaw 经常“傻傻的”记不住东西、搜索乱试、任务中断?如何通过三件事(记得住、找得到、断不了)让它真正可靠?
很多人安装后发现 Agent 聊完 React 后几天再问就全忘。核心原因是缺少“记得住、找得到、断不了”三层机制。
记得住——三层记忆模型
Tier 1:原始记录(memory/learning/ 目录,只追加不删除)。
Tier 2:每日提炼(memory/YYYY-MM-DD.md,每天一个文件)。
Tier 3:长期记忆(控制在 100 行以内,每次 session 加载)。
7 个核心文件互不重复:怎么工作、我是谁、我服务谁、怎么操作、我记得什么、我在哪里失败过、团队共识。核心原则:一个信息只存一个地方。
关键铁律:写入已有文件永远用 edit 追加,绝不用 write 覆盖。我曾经因为让 Agent write 操作,把 345KB 的 8509 行学习笔记直接覆盖成 9.9KB,一个月记录全丢。从此这条规则写进 ERRORS.md 和 SHARED.md,所有 Agent 启动就知道。
Heartbeat 机制(默认每 30 分钟触发)用来动态吸纳记忆。我设置每 6 小时一次记忆深化整理:读取最近日志 → 清理过时信息 → 提炼新知识。搭好后,Agent 能自动接上昨天的 React Hooks 进度,不用重复教。
作者反思:这个覆盖事故让我彻底明白,Agent 的“记忆”其实是文件系统,不是 LLM 的短期记忆。把重要状态外化到文件,才是 OpenClaw 的灵魂。
找得到——搜索决策树
OpenClaw 有 web_fetch、curl、browser 等工具,Agent 经常乱试 5-10 分钟。我的方案:先判断是否需要 JS 渲染或登录态,需要就用 browser;否则用免费全网搜索工具;失败再按错误类型切换(SSRF 用 curl,其他用 web_fetch)。特殊规则如 GitHub 只能用 browser 也文档化。
效果:搜索任务从 5-10 分钟试错变成 1 分钟内命中,token 砍一半。思路是把踩过的坑写进 SHARED.md,所有 Agent 启动就自动读取。
断不了——计划文件模式
Context 窗口有限,对话太长会被压缩,任务状态丢掉。解决办法:收到复杂任务时,先创建 temp/任务名-plan.md,结构是目标 + 步骤列表(带 checkbox)+ 当前进度 + 问题 + 下一步。每完成一步就更新文件。Heartbeat 还能主动汇报进度。
场景举例:你晚上睡觉,Agent 跑 20 步任务,中间 context 压缩 3 次、跨 2 个 session。早上它自动读计划文件接着第 15 步干,完全不丢进度。
(此处插入中级篇原配图)
中级篇完整落地手册包含 7 种信息写入规则、决策树参数、计划文件模板、Heartbeat 代码、4 个实战场景、8 个 Q&A。
高级篇:如何用 Skill、Hook、MCP 和自主任务,把 Agent 从“听话实习生”变成“独立负责项目的正式员工”?
本小节欲回答的核心问题:中级篇让 Agent 记得住、找得到、不断线后,为什么还是需要你一步步指挥?如何通过 Skill、Hook、MCP 和自主任务让它真正独立干活?
高级篇解决指令驱动到目标驱动的升级。
Skill——岗前培训
Skill = 特定业务知识的手册,放在 skills/ 目录,触发词匹配后注入 context。和 SOUL.md 的区别:SOUL 是通用规范,Skill 是业务流程。
杀手案例:日报 Skill。只需说“写日报”三个字,Agent 自动读取 memory/YYYY-MM-DD.md,按固定格式输出(完成的工作、重要决策、遇到的问题、明天计划)。以前要 50 字指令,现在 3 字,而且跨 session 永久生效。
Hook——定 SOP
Hook = 反射弧,特定事件发生时直接跑 TypeScript 代码,不经过 LLM。
结构:HOOK.md(声明事件)+ handler.ts(执行代码)。
案例:session-loader Hook,新 session 自动加载今天日记文件。代码示例:
从此“你先看一下今天的计划”这句话永远消失。
进阶应用:监听 compact 事件自动保存任务状态、拦截危险 write 操作。
MCP——开系统权限
MCP = Model Context Protocol,AI 世界的 USB 接口。配置 mcporter.json 即可接文件系统、数据库、浏览器等。
最简文件系统案例:
验证:mcporter list 和 mcporter call filesystem read_file。Agent 就能直接读写指定目录。
自主任务——独立负责项目
给一个目标,Agent 自己创建计划文件、拆解步骤、执行、更新进度、跨 session 继续。
案例:我给目标“完成高级篇 6 个方向素材采集”,Agent 自己拆 6 步、创建 temp/advanced-material-plan.md、每阶段更新 checkbox,Heartbeat 检查进度,最终输出 160KB+ 素材。即使 context 压缩 2 次、跨 3 个 session 也无中断。
(此处插入高级篇 Skill/Hook/MCP 示意图)
(此处插入自主任务流程图)
中级篇的计划文件 + Heartbeat 在高级篇变成 Agent 自己创建和执行的基础设施。
实用摘要 / 操作清单
-
基础:装 Node.js → curl 安装 → onboard –install-daemon → 配置 Telegram Token + 模型 → 加代理。 -
中级:建三层记忆 + 7 核心文件 + edit 铁律 + 搜索决策树 + temp/plan.md。 -
高级:创建 skills/xxx/SKILL.md(触发词)→ hooks/xxx/handler.ts(事件)→ mcporter.json(MCP)→ 目标驱动任务。 -
安全永远第一:API 预算上限 + approvalRequired + 本地监听。
一页速览(One-page Summary)
OpenClaw = 本地 AI 网关
基础 = 能用(Telegram + 模型)
中级 = 好用(记忆三层 + 决策树 + 计划文件)
高级 = 自主(Skill 知识 + Hook 自动 + MCP 工具 + 目标驱动)
核心哲学:重要状态外化到文件,踩过的坑写进 SHARED.md,所有 Agent 共享。
FAQ
Q1:OpenClaw 适合 Windows 用户吗?
A:是的,必须装 WSL2 + Ubuntu 22.04,操作和 Linux 一致。
Q2:为什么我的 Agent 经常忘记昨天聊的内容?
A:因为缺少三层记忆模型和 edit 追加规则,建议立即搭建 Tier 1-3 并把铁律写入 ERRORS.md。
Q3:搜索任务总是试错 5-10 分钟,怎么办?
A:建立搜索决策树,先判断 JS 渲染,再用免费工具,最后 fallback browser,并文档化到 SHARED.md。
Q4:复杂任务做到一半突然中断是什么原因?
A:Context 压缩导致,解决办法是创建 temp/任务名-plan.md 并让 Heartbeat 检查。
Q5:Skill 和 Hook 的区别是什么?
A:Skill 是触发词注入的业务手册,Hook 是事件直接跑的 TypeScript 代码,前者建议,后者铁律。
Q6:MCP 需要额外 API Key 吗?
A:本地文件系统 MCP 完全免费,只需配置 mcporter.json 并限制访问路径。
Q7:如何让 Agent 自己拆解任务?
A:给目标后让它创建计划文件 + 更新 checkbox + Heartbeat 驱动,即可实现目标驱动。
Q8:配置复杂,新手会不会卡住?
A:用 Web UI 配置模型,代理验证先 curl 测试,遇到问题直接 openclaw logs 排查,基本都能 1 小时内跑通。
通过这套从基础到高级的完整体系,你不再是“教 Agent”,而是“管理数字员工”。记忆不会丢、搜索不试错、任务不中断,最终实现睡一觉它帮你干一夜的效率跃升。这就是 OpenClaw 真正的价值所在。

