四虾阵：从聊天机器人到生产力系统的三天进化全记录

你是否曾想过，如何让多个AI助手像一个团队一样协同工作，自动完成从任务拆分、内容创作到代码编写的全流程？本文将详细拆解一个名为“四虾阵”的AI Agent系统如何在三天内完成从概念到可运行系统的迭代，分享其中的关键步骤、遇到的挑战以及学到的宝贵经验。

什么是四虾阵系统？

四虾阵是一个由四个AI Agent组成的协作系统，它们各司其职，共同完成复杂任务。这个系统的核心目标是将原本需要人工协调的AI协作流程自动化，形成一个高效的生产力系统。

系统架构概览

四虾阵系统采用了主从架构，由一个协调者（小龙虾）和三个专业Agent（码力、笔锋、谋士）组成：

Agent名称	模型	职责	成本策略
小龙虾（协调者）	Claude Opus 4-6	任务调度与协调	高成本模型
码力（编码者）	GPT-5.3-Codex	全栈编码开发	免费额度
笔锋（创作者）	Claude Opus 4-6	内容创作与写作	高成本模型
谋士（策略者）	GPT-5.4	策略分析与审稿	免费额度

系统运行在一台VPS上，通过OpenClaw Gateway进行通信。这种设计实现了成本优化——昂贵的模型只用于协调和内容创作，而编码和分析则使用免费额度。

第一天：能说话，但不靠谱

系统搭建完成的第一天，四个Agent已经能够接收任务、执行工作并返回结果。但此时系统存在几个致命问题。

遇到的主要问题

缺乏行为约束
- 笔锋写推文时质量不稳定，时好时坏
- 谋士审稿时标准不一，有时啰嗦有时简略
- 码力写代码时异常处理随意，缺乏一致性
没有协作规范
- 谁应该给谁发送消息？
- 任务完成后应该通知谁？
- 超时了怎么办？
- 所有这些都依赖Agent的推理猜测
任务追踪缺失
- 任务派发后就像扔进黑洞
- 协调者不知道码力执行到哪一步
- 无法确认笔锋的稿件是否已被谋士审阅

第一天的成果

尽管存在问题，第一天仍完成了基础能力验证：

笔锋撰写了一篇2800字的X平台文章
谋士对文章进行了审稿，给出了8.2/10的评分
根据谋士建议，笔锋修改了第二版
码力使用Claude Code编写了一个记账CLI工具

结论：基础能力已经具备，但缺乏管理层的协调和规范。

第二天：给每只虾装上Harness

第二天，系统开发团队学习了revfactory/harness项目的6篇方法论文档，核心发现包括：

学到的关键原则

通信协议明确化
- 每个Agent必须明确“从谁收消息、给谁发消息、完成后做什么”
错误处理机制
- 超时、失败、需求不清晰等情况不能由Agent自行决定
渐进式披露
- 不要把所有规则塞进一个文件，按需加载
断言式审稿
- 不是开放式“你觉得怎么样”，而是逐项检查通过/失败

系统改进措施

1. 重写SOUL.md文件

四个Agent的SOUL.md文件全部重写，加入了明确的行为规范：

小龙虾（协调者） 加入了显式路由表：

写文案、推文、文章 → 笔锋
代码、工具、API、bug → 码力
审稿、分析、评估、策略 → 谋士

这样不再依赖推理猜测，而是直接查表分配任务。

谋士加入了断言式审稿格式，7项逐一检查：

Hook强度 → 通过/失败
结构节奏 → 通过/失败
数据支撑 → 通过/失败
术语统一度 → 通过/失败
收口力度 → 通过/失败
事实准确 → 通过/失败
平台适配 → 通过/失败

笔锋加入了渐进式披露，将不同平台的规范拆分成独立文件：

workspace-writer/references/
├── x-platform.md # X平台规范
├── wechat-platform.md # 公众号规范
└── rednote-platform.md # 小红书规范

写X推文时只加载x-platform.md，不加载其他平台规范，节省2/3的token消耗。

2. 安装工具链

Codex CLI v0.117.0
Codex Plugin for Claude Code（/codex:review + /codex:rescue）
码力使用Codex连续交付了3个真实工具：记账CLI、待办CLI、网页标题抓取器

第二天的收获：系统从“能干活”变成了“有章法地干活”。

第三天：从“能干活”到“有系统地干活”

第三天是变化最大的一天，团队连续推出了6个版本，系统完成了质的飞跃。

版本迭代过程

v1：共享任务板

采用文件型任务管理，使用board.json + queue.md：

不用数据库，不用外部服务
一个JSON文件作为任务总表
一个Markdown文件作为人类可读视图

v2：执行器CLI

开发了task_board.py命令行工具，支持增删改查任务：

python3 task_board.py create --title "写推文" --owner writer
python3 task_board.py update task-001 --status done
python3 task_board.py list
python3 task_board.py check-overdue --mark

v3：调度包装器

开发了lobster_ops.py，小龙虾派活时自动建任务，长任务自动绑定运行时：

python3 lobster_ops.py dispatch \
  --title "写一条四虾阵推文" \
  --brief "X平台，杰森AI出海风格" \
  --agent writer

v3.1：OpenClaw进程会话真实绑定

将OpenClaw原生的exec background后台session直接绑定到任务：

调度 → 执行后台 → 绑定进程 → 完成运行时 → 完成
任务里直接记录sessionId、工作目录、命令、状态

v3.1.1：自动收口（关键改进）

之前的链路是：跑完 → 手动调finalize-runtime → 更新状态
现在变成：生成自带收口的包装命令，执行完后自动调用finalize-runtime

v3.1.2：ACP运行模式

把Codex这类外部编码Agent也接进来：

分发 → sessions_spawn(runtime=acp, agentId=codex, mode=run) → bind-acp → finalize → 完成
注意：owner是业务角色，runtime agent是执行引擎，这是两个不同概念

最后：控制中心

安装了openclaw-control-center Web控制台：

单向同步：board.json → control center
board.json是唯一真相，Web UI是只读镜像
每次dispatch和finalize自动推送，同步失败不阻塞主流程

第三天的收获：系统从“有章法地干活”变成了“有系统地干活”。

三天进化总结

天数	系统状态	关键产出
第一天	能说话	4 Agent通信、写→审→改流程、3个工具
第二天	有章法	Harness方法论、SOUL.md升级、Codex工具链
第三天	有系统	任务板6版迭代、4条执行链路、Web控制台

已验证的4条执行链路

链路A：tmux长任务
dispatch → tmux → tail-log → finalize → done
链路B：OpenClaw后台进程
dispatch → exec background → bind-process → finalize → done
链路C：自动收口
dispatch → render-process-wrapper → exec background → 自动finalize → done
链路D：ACP run（外部引擎）
dispatch → sessions_spawn(codex, mode=run) → bind-acp → finalize → done

从Claude Code源码学到的下一阶段规划

通过分析Claude Code CLI的源码（约1884个TypeScript文件），发现了几个值得借鉴的设计：

1. TaskTool多代理协作

Claude Code有一个TaskTool专门用于任务拆分和并行执行。对四虾阵的启发：当前任务是串行的（笔锋→谋士→笔锋），下一步应该支持并行Fan-out，小龙虾拆完任务后，码力和笔锋同时开工，各自完成后汇总。

2. /compact上下文压缩

Claude Code内置了/compact命令自动压缩对话上下文。对四虾阵的启发：长任务里Agent的上下文会越来越大，token消耗越来越多。应该在任务板层面做上下文管理，任务完成后自动compact，只保留关键结论和产出路径。

3. /review + /commit代码闭环

Claude Code的代码审查和提交是一体化的：审完直接commit。对四虾阵的启发：码力写完代码后应该自动走一轮review，审过了直接commit，实现“写完审完提交完一条龙”。

4. MCP协议

Claude Code完整实现了Model Context Protocol，支持工具调用、资源管理、外部服务接入。对四虾阵的启发：现在四虾阵的工具全靠OpenClaw内置。如果接入MCP，可以让Agent直接调用外部服务，如飞书API、GitHub API、数据库查询，不需要写wrapper脚本。

5. 插件系统

Claude Code的/plugin系统支持技能热插拔。对四虾阵的启发：笔锋的平台规范现在是reference文件。如果做成skill插件，可以支持“写小红书帖子”时自动加载小红书skill，包含模板、示例、敏感词过滤。

下一阶段路线图

Phase 1：自动化闭环（1-2周）

写→审→改全流程走task board，不再手工sessions_send
ACP run自动收口（类似process wrapper）
Codex认证走完，码力真正通过Codex编码
心跳巡检上线（定期检查邮件/日历/任务状态）

Phase 2：效率提升（2-4周）

并行Fan-out：复合任务拆后多Agent同时执行
模型热切换：简单任务走免费，复杂任务自动切Opus
审稿结果持久化：assertion数据支持跨任务对比
上下文管理：长任务自动compact

Phase 3：生态接入（1-2月）

飞书多维表格同步（task board双写Bitable）
Cron定期任务（每日站会、每周复盘、定时内容生产）
更多A CP harness（Claude Code / Gemini CLI / OpenCode）
MCP协议接入（让Agent直接调外部API）

Phase 4：产品化（2-3月）

四虾阵开源starter kit
成本追踪仪表盘（按Agent/任务类型统计）
质量仪表盘（谋士评分趋势、修改轮次、通过率）
Agent自进化（基于历史任务数据自动调优SOUL.md）

FAQ常见问题解答

问题1：四虾阵系统适合哪些场景？

四虾阵系统特别适合需要多AI协作的复杂任务，如内容创作流程（写作→审稿→修改）、软件开发流程（需求分析→编码→测试）、市场分析流程（数据收集→分析→报告生成）等。

问题2：如何开始使用四虾阵系统？

首先需要搭建基础环境：一台VPS、OpenClaw Gateway，然后配置四个Agent的SOUL.md文件。建议从简单的任务开始测试，逐步增加复杂度。

问题3：系统如何处理任务超时？

系统在SOUL.md中定义了超时处理机制，当任务超时时会自动通知协调者，由协调者决定是重试、重新分配还是标记为失败。

问题4：如何监控系统运行状态？

通过Web控制台可以实时查看任务状态、Agent工作情况和系统性能指标。所有状态都从board.json同步，确保信息一致性。

问题5：系统成本如何控制？

通过模型分配策略控制成本：协调和内容创作使用高成本模型，编码和分析使用免费额度。同时通过渐进式披露减少不必要的token消耗。

系统价值与未来展望

四虾阵系统的最大价值在于将AI协作从“能聊天”提升到“能系统化工作”。通过三天迭代，系统完成了从概念验证到可运行系统的转变，证明了AI Agent协作的可行性。

核心价值点

可靠性优先：让AI更可靠比让AI更聪明更重要
任务可追踪：每个任务都有明确状态和执行记录
成本可控：通过智能分配优化模型使用成本
可扩展性：支持添加新的Agent和工具

未来发展方向

从Claude Code的成熟度来看，一个完整的AI编码工具需要约1884个文件、50个命令、30个工具。四虾阵目前只达到这个体量的1%，但方向已经明确：

下一个3天，从系统到产品。通过持续迭代，四虾阵有望成为一个真正可用的Agent Ops系统，让更多人能够享受AI协作带来的生产力提升。

通过三天的迭代，四虾阵系统展示了AI Agent协作的潜力和实现路径。从基础通信到系统化工作，每一步都解决了实际问题，为构建可靠的AI生产力系统提供了宝贵经验。无论你是技术开发者还是AI应用者，这个案例都值得深入研究和借鉴。

四虾阵AI系统进化史：三天打造多智体协作，揭秘Agent Ops生产力革命