用 Hermes 跑 Moss Trading Agent:一套完整的 AI 交易工作流详解

本文核心问题:如果已经在使用 Hermes,如何构建一套完整、可执行的 Moss 交易 Agent 工作流?以及这套组合相比单独使用 Moss 有何实际价值?


一、系统全貌:Hermes 与 Moss 分别解决什么问题?

核心问题:Hermes 和 Moss 在整个交易系统中分别承担什么职责?

一句话答案:Hermes 是运行和编排 Agent 的操作环境,Moss 是负责交易执行与策略验证的引擎。

在实际架构中,两者分工非常清晰:

组件 职责 关键能力
Hermes Agent 运行环境 终端操作、文件管理、模型调度、记忆系统、Skill 扩展
Moss 交易引擎 策略生成、信号融合、回测、实盘执行
Skill(Moss Trade Bot Factory) 桥梁 自然语言 → 量化参数

可以用一个直观的比喻理解:


  • Hermes = 操作系统

  • Skill = 应用程序

  • Moss = 交易所 + 策略引擎

这意味着:Hermes 并不直接参与交易,它负责“如何生成策略”;而 Moss 负责“如何执行策略”。


二、整体工作流拆解:从安装到实盘的完整路径

核心问题:从零开始,如何一步步跑通完整交易 Agent?

整个流程可以拆分为五个阶段:

工作流示意图

Step 1:安装 Hermes

核心问题:如何搭建 Agent 运行环境?

安装命令:

curl -fsSL <安装脚本地址> | bash

安装流程:

  1. 启动安装向导

  2. 选择 Quick Setup

  3. 配置模型(可选方案):


    • 本地模型:Ollama + Gemma 4(零成本)

    • 云模型:Claude / GPT-Codex(更强推理能力)

验证安装:

hermes doctor
hermes chat -q "Hello, what tools do you have?"

关键点:


  • Hermes 支持 200+ 模型

  • 支持本地 / VPS / Docker 部署

  • 提供跨会话记忆能力

Step 2:安装 Moss Trade Bot Factory Skill

核心问题:如何让 Hermes 具备“交易能力”?

这是整个系统最关键的一步。

安装 Skill 后,Hermes 可以:


  • 理解交易策略的自然语言描述


  • 自动生成 30+ 个量化参数


    • 杠杆

    • 多空偏好

    • 入场阈值

    • 止损倍数

    • 信号权重

本质上,这一步完成了:

从“语言描述”到“可执行策略”的转换


Step 3:用自然语言描述策略

核心问题:如何定义一个交易 Agent?

示例:

我判断后续 BTC 会进入震荡行情,
需要一个基于短时信号做多空双向操作的 trading agent,
目标收益率在 100% 以上。

Hermes 会自动执行:

  1. 调用 Skill
  2. 生成参数
  3. 发起回测
  4. 输出结果

关键理解:

你不再写代码,而是在定义“策略意图”。


Step 4:策略迭代与进化

核心问题:Hermes 如何优化策略?为什么效果差异巨大?

这是整个系统最有价值的部分。

在实验中,Hermes 的优化过程:


  • 70 组随机参数探索(跳出局部最优)

  • 筛选种子参数

  • 对“优化策略本身”进行二次搜索(22 套 schedule)

这意味着:

它不仅在调参数,还在优化“如何调参数”。

对比结果:

方法 回测收益
Hermes(随机 + 元搜索) +157%
线性调参 +21%

结论:
策略质量的差距,不在模型,而在搜索方法。


Step 5:部署到 Moss 实时模式

核心问题:如何进入真实交易环境?

流程:

  1. 导出最终参数文件
  2. 上传到 Moss 实时模式
  3. 启动 Agent

运行特点:


  • 使用真实行情数据

  • 所有交易记录公开

  • 收益进入排行榜

三、Hermes + Moss 的核心优势

核心问题:相比直接用 Moss 网页版,这套组合多了什么能力?


1. 深度策略搜索能力

结论:Hermes 支持多轮自主优化,而非一次性生成。

对比:

模式 特点
Moss Hosted Agent 一次生成
Hermes 多轮迭代 + 自动优化

Hermes 能做到:


  • 随机搜索

  • 分段回测

  • 自动分析失败原因

  • 调整进化策略

2. 跨会话记忆

结论:Agent 会“记住你是谁”。

示例:


  • 三周前:你说“不喜欢非农前开仓”


  • 三周后:它仍然遵守


  • 上个月:测试 5 个策略


  • 本月:可以直接查询“哪个回撤最低”


3. Skill 自动化能力

结论:重复流程可以被抽象为自动执行任务。

示例:

帮我做每周策略复查

自动执行:


  • 回测

  • 指标分析

  • 参数调整

  • 对比输出

4. 模型自由选择

结论:不同任务用不同模型,成本与性能可控。

示例组合:

场景 模型
策略生成 Claude
日常查询 GLM 5.1
基础检查 Gemma 4

关键点:


  • 交易执行不依赖模型

  • 模型只负责“生成策略”

四、实验中的关键发现

核心问题:从实验中可以提炼出哪些通用经验?

实验细节

1. 搜索策略决定结果

不是“搜索多久”,而是“怎么搜索”。


2. 参数结构影响实盘表现

Hermes 的设计:


  • 不写死 timeframe

  • 不写死 symbol

  • 只保留策略核心

优势:


  • 可跨环境复用

  • 更灵活部署

3. 回测的真正意义

回测不是看收益,而是验证 Agent 是否能完成完整流程。

测试场景:


  • BTC 从 123K → 68K(单边下跌)

关键观察:


  • 是否能完成迭代

  • 是否能稳定输出结果

4. 数据可信度是底线

Hermes 的特点:


  • 每一轮数据可验证

  • 无数据错位

结论:
在交易中,错误数据会导致全链路错误。


五、双层“灵魂”:SOUL.md 与策略描述

核心问题:Agent 的“行为”和“交易风格”如何定义?

双层结构

两层结构:

1. Hermes 层(SOUL.md)

定义:


  • 如何沟通

  • 如何思考

  • 如何处理不确定性

2. Moss 层(策略描述)

定义:


  • 做多还是做空

  • 杠杆大小

  • 入场/退出规则

参数拆分:

类型 说明
性格参数 固定不变
战术参数 每周 ±30% 进化

关键结论:

两层完全独立:


  • SOUL.md 不影响交易

  • 交易参数不影响对话

六、适用人群分析

核心问题:谁应该使用 Hermes + Moss?


适合人群

  1. 已有 Hermes 用户
  2. 追求极致策略优化
  3. 需要特定模型
  4. 重视数据控制
  5. 开发者(自动化需求)

不适合人群


  • 只想“一句话创建 Agent”

  • 不关心策略优化深度

建议:直接用 Moss Hosted Agent


七、生态趋势:通用框架 + 垂直引擎

核心问题:AI Agent 系统正在如何演进?

当前趋势:

层级 代表 作用
通用框架 Hermes 运行 Agent
垂直应用 Moss 执行任务

两者关系:

不是竞争,而是协作。


八、作者反思与实践启示

核心问题:这套系统真正带来的改变是什么?

从整个流程可以总结几个关键认知:

1. 参数不再是核心,搜索方式才是

传统思路:


  • 手动调参

新思路:


  • 自动搜索策略空间

2. Agent 的价值在“过程”,不是“结果”

回测收益并不重要,重要的是:


  • 是否可复现

  • 是否可解释

  • 是否可迭代

3. 结构化设计决定长期可扩展性

例如:


  • 参数与环境分离

  • 双层灵魂结构

这些设计使系统具备长期演进能力。


九、实用操作清单

核心问题:如何快速落地?

快速上手步骤:

  1. 安装 Hermes
  2. 配置模型
  3. 安装 Moss Trade Bot Factory Skill
  4. 输入策略描述
  5. 等待自动回测与优化
  6. 导出参数
  7. 上传 Moss 实盘运行

十、一页速览(One-page Summary)


  • Hermes:Agent 操作系统

  • Moss:交易执行引擎

  • Skill:连接两者

核心流程:

描述策略 → 自动生成参数 → 多轮优化 → 实盘执行

关键优势:


  • 自动搜索策略空间

  • 跨会话记忆

  • Skill 自动化

  • 模型自由切换

核心认知:

策略质量 ≈ 搜索方法,而非模型本身


十一、常见问题 FAQ

1. Hermes 是否参与实际交易?

不会,交易执行完全由 Moss 完成。


2. 模型选择会影响交易结果吗?

不会直接影响,只影响参数生成质量。


3. 是否必须使用云模型?

不必须,可以使用本地模型。


4. Hermes 和 Moss 是否强绑定?

不是,通过 Skill 解耦连接。


5. 回测收益是否代表实盘表现?

不完全代表,实盘才是最终验证。


6. 是否可以自动化整个研究流程?

可以,通过 Skill 实现。


7. 参数是否可以复用?

可以,设计上支持跨环境复用。


8. 新手是否适合这套方案?

不太适合,新手更适合直接使用 Hosted Agent。