即梦CLI×Hermes自动生图生视频终极教程：睡一觉醒来整部短剧素材全生成！

高效码农

3 小时前

Hermes 接入即梦 CLI 完整教程：实现自动生图与生视频，解放重复劳动

本文欲回答的核心问题：作为专科及以上学历的技术、产品或工程类读者，如何基于即梦 CLI 将 Hermes 接入，实现自动提交生图、生视频任务、查询结果并接入工作流，从而让短剧团队等场景下的重复劳动被彻底解放？

即梦的 Seedance 2.0 目前只能同时提交 10 个任务，许多短剧团队为了避开高峰期，甚至选择凌晨开工或通宵盯任务。接入即梦 CLI 之后，Hermes 可以代替人工完成传递提示词、等待任务、检查结果等重复操作。更进一步，如果把分镜库接入进来，就能实现自动排队——睡一觉醒来，整部短剧的镜头素材就全部生成好了。

本文将完整整理操作步骤与踩过的所有坑。如果你正准备配置，可以直接把这篇教程发给 Hermes，让它按步骤执行，省去自己一步步调试（OpenClaw 同样适用）。完成配置后，你的 Hermes 至少能做到调用即梦 CLI、检查登录状态、查询额度、提交生图或生视频任务、查询异步任务结果，并将结果无缝接入后续工作流。

前提说明：即梦 CLI 目前仅面向即梦高级会员开放，高级会员可享受生图免费权益。

以下是 Hermes 实际生成图片与视频并回传的演示效果：

0:01 / 0:13

（演示中 Hermes 已自动完成提示词提交、任务轮询并返回结果）

环境前提：开始接入前必须确认哪些硬件和软件条件？

本节欲回答的核心问题：在安装即梦 CLI 并接入 Hermes 之前，到底需要准备哪些最基础的环境，才能保证后续每一步都顺利跑通？

即梦 CLI 支持 Linux、macOS、Windows 系统（从 v1.3.4 版本起正式支持 Linux arm64）。在动手之前，请先逐一确认以下几点：

Hermes 已可正常运行；
Hermes 具备 terminal 执行能力；
终端环境中可正常运行 curl 或 wget 命令；
如果计划使用 headless 登录方式（Agent 场景下强烈推荐），机器上必须安装 Google Chrome；
如果选择本地浏览器登录方式，机器上需有可正常启动的默认浏览器。

这些条件看似基础，却直接决定后续登录和任务提交能否成功。很多人在这一步就卡住，是因为忽略了 headless 模式对 Chrome 的依赖，或者终端缺少 curl 支持。确认这些前提后，再进入安装环节，就能避免走弯路。

作者反思：我第一次配置时，就是因为没提前检查 Chrome 是否可用，直接跳到 headless 登录，结果卡了半天。后来回头看环境前提，才真正理解“每一步都建立在前一步可靠之上”这个道理。这也是为什么我把环境检查放在最前面——它不是可有可无的 checklist，而是整条链路的根基。

安装与验证 CLI：如何一行命令完成安装并快速确认可用？

本节欲回答的核心问题：即梦 CLI 该如何安装？安装完成后又该用什么命令验证它真正可用，而不是仅仅“看起来装好了”？

官方提供了一行安装命令，操作极其简便：

curl -fsSL https://jimeng.jianying.com/cli | bash

这条命令会自动下载 CLI 二进制文件、version.json，并尝试将安装目录写入 PATH。同时，SKILL.md 文件会被下载到 ~/.dreamina_cli/dreamina/SKILL.md 目录下。请注意：这个 SKILL.md 只是本地下载，并不会自动安装进 Hermes 的 skills 目录，需要后续手动纳入。

安装完成后，立即进行验证：

which dreamina
dreamina -h

如果命令正常返回路径，并且 dreamina -h 显示出以下子命令列表，就说明 CLI 本体安装成功：

login / relogin / logout —— 登录管理
user_credit —— 查询额度
text2image / text2video —— 文生图、文生视频
image2image / image2video —— 图生图、图生视频
multiframe2video / multimodal2video —— 多帧/多模态生视频
query_result —— 查询异步任务结果
list_task —— 查看历史任务

应用场景说明：假设你是一位短剧制作工程师，每天需要批量生成几十个镜头。CLI 安装验证通过后，你就可以让 Hermes 直接调用这些子命令，而不再手动打开网页一个个提交。这一步验证非常关键——它不是形式主义，而是确保后续所有自动化脚本都能基于可靠的 CLI 运行。

作者反思：我曾以为“安装完就万事大吉”，结果 dreamina -h 能跑却登录失败。后来才明白，验证 CLI 可用必须看子命令列表完整性。这次教训让我养成“每装一个工具都立即验证 help”的习惯，也让 Hermes 的自动化流程更稳健。

登录：如何选择最适合 Hermes 的登录方式并快速自检？

本节欲回答的核心问题：即梦 CLI 的登录环节有哪些方式？在 Hermes 或 Agent 场景下，哪种方式最高效，且如何立即确认登录状态真正生效？

手动登录最简单，直接执行：

dreamina login

CLI 会自动拉起默认浏览器，引导完成授权流程。

如果是 Hermes / Agent 场景，推荐使用 headless 模式：

dreamina login --headless

当前版本明确要求 –headless 依赖 Google Chrome。如果机器无法使用 Chrome 或浏览器拉起失败，也支持手动导入登录态，按照指引一步步完成即可。

遇到浏览器未能自动拉起或登录过程卡住的情况，可添加 –debug 参数重试：

dreamina login --debug

此模式会在终端打印回调地址和详细调试信息，帮助快速定位问题。

登录成功后，立即执行自检命令：

dreamina user_credit

如果终端返回包含余额信息的 JSON 数据，说明登录状态和环境配置全部生效，可以正式开始提交生成任务。

场景化说明：短剧团队凌晨批量生成素材时，使用 headless 登录能让 Hermes 在无人值守环境下自动完成授权，避免每次都手动干预浏览器。这正是“睡一觉素材就生成好”的关键前提。

作者反思：我最初尝试 Safari 登录，结果遇到回调异常。后来改用 Chrome + headless 模式，一次成功。这让我深刻体会到“工具的兼容性往往藏在小细节里”——选择对的登录方式，不是多此一举，而是决定整个流程能否真正无人值守。

核心命令用法：生图、生视频、查询结果的完整参数与实际操作示例

本节欲回答的核心问题：即梦 CLI 最常用的生图、生视频命令到底该怎么写？每个命令的关键参数是什么？如何结合 –poll 实现自动化等待，并把结果直接接入工作流？

所有任务提交命令都支持通用参数 --poll=<秒数>（例如 --poll=30）。加入此参数后，CLI 会在提交后以每秒 1 次的频率轮询任务状态，最长等待指定秒数。如果等待时间内任务完成，会直接在终端输出最终结果；如果超时，则返回 querying 状态的中间结果，后续可通过 query_result 命令继续查询。

1. 文生图（text2image）

dreamina text2image \
  --prompt="一只戴墨镜的橘猫" \
  --ratio=1:1 \
  --resolution_type=2k \
  --poll=30

场景：短剧开场镜头需要一个卡通风格的角色形象，Hermes 可直接用这条命令生成 2K 分辨率的正方形图片，30 秒内完成轮询并返回结果。

2. 文生视频（text2video）

dreamina text2video \
  --prompt="镜头推进，一只橘猫从沙发上跳下来" \
  --duration=5 \
  --ratio=16:9 \
  --video_resolution=720P \
  --poll=30

场景：短剧中需要一段 5 秒的动态镜头，Hermes 提交后可自动等待生成 720P 横版视频，完成后直接回传给后续剪辑流程。

3. 图生图（image2image）

dreamina image2image \
  --images ./input.png \
  --prompt="改成水彩风格" \
  --resolution_type=2k \
  --poll=30

注意：–images 参数必须指向本地图片文件路径。

场景：已有角色草图，想快速迭代成水彩风格用于分镜预览，Hermes 可自动完成风格转换并返回 2K 结果。

4. 图生视频（image2video）

dreamina image2video \
  --image ./first_frame.png \
  --prompt="镜头慢慢推近" \
  --duration=5 \
  --poll=30

注意：–image 参数（单数）指向本地首帧图片。

场景：短剧中已有第一帧静态图，需要生成推镜头动态视频，Hermes 可直接把静态输入转化为 5 秒视频素材。

5. 查询异步任务结果（query_result）

如果未使用 –poll 或轮询超时，命令会返回 submit_id。使用以下方式查询：

# 基础查询
dreamina query_result --submit_id=<你的_submit_id>

# 查询并直接下载到指定目录
dreamina query_result --submit_id=<你的_submit_id> --download_dir=./downloads

场景：批量生成 10 个任务后，Hermes 可记录每个 submit_id，定时查询并把成功结果自动下载到工作目录，供下一步剪辑使用。

6. 查看历史任务（list_task）

# 查看所有任务
dreamina list_task

# 仅查看成功的任务
dreamina list_task --gen_status=success

# 根据 submit_id 筛选
dreamina list_task --submit_id=<你的_submit_id>

场景：项目复盘时，Hermes 可快速列出当天所有成功素材，方便团队审查哪些提示词效果最好。

作者反思：我发现不同子命令的参数细节差异很大（比如 image2image 用 –images 复数，image2video 用 –image 单数），每次提交前先运行对应 -h 命令已成为习惯。这看似小事，却避免了 80% 的语法错误，也让 Hermes 的自动化脚本更健壮。

接入 Hermes：如何把 CLI 固化成 skill，实现真正无人值守的工作流？

本节欲回答的核心问题：CLI 安装登录完成后，如何让 Hermes 真正“懂”这些命令，并把整个流程封装成可重复使用的 skill？

如果 Hermes 与 CLI 安装在同一台机器，最简单的验证方式是让 Hermes 依次执行以下三条命令：

dreamina -h
dreamina user_credit
dreamina text2image --prompt="一只戴墨镜的橘猫" --ratio=1:1 --resolution_type=2k --poll=30

三条全部跑通，就意味着 Hermes 已能正常调用即梦 CLI。

为了长期使用，建议把流程固化成 Hermes skill。安装时已自动下载官方 SKILL.md（位于 ~/.dreamina_cli/dreamina/SKILL.md），可作为参考模板。skill 至少应包含以下规则：

先执行 dreamina -h 确认 CLI 可用；
先执行 dreamina user_credit 确认登录态和余额；
提交任务时必须记录 submit_id；
查询结果时以 gen_status 为准判断成功；
失败时读取 fail_reason 获取具体原因；
不要仅依赖 exit code 判断任务是否成功。

场景化价值：接入分镜库后，Hermes 可自动读取下一条分镜提示词、提交任务、等待结果、下载素材并推送到剪辑软件，整部短剧素材生成过程实现全自动。团队再也不需要通宵盯任务，效率直接提升几个量级。

作者反思：把 CLI 接入 skill 的过程，让我真正感受到“工具赋能”的力量。最初只是为了省几分钟重复操作，后来却演变成整条生产线的自动化。这也提醒我：任何技术接入，都要从“先跑通最小链路”开始，再逐步扩展复杂度。

踩坑记录：哪些常见问题最容易导致失败？如何提前规避？

本节欲回答的核心问题：接入即梦 CLI 和 Hermes 时，最容易踩的坑有哪些？实际操作中该如何判断和解决？

以下是实际踩过的所有坑及对应解决方法：

dreamina -h 能跑 ≠ 真正可用
只能说明 CLI 安装成功，不代表登录态和账号正常。必须先完成 login + user_credit 才能确认。
需要高级会员权限
非高级会员账号会直接报 not vip error。CLI 目前仅面向即梦高级会员开放。
exit code=0 ≠ 生成成功
异步任务中，命令返回 0 仅表示“提交成功”，并非“生成完成”。必须检查 gen_status 字段。
Safari 登录可能存在兼容性问题
部分用户反馈 Safari 会出现回调异常。建议优先使用 Chrome，或直接切换到 –headless / 手动导入方案。
先测图片，再测视频
视频链路参数更多、耗时更长，不适合作为第一步验证。建议先用 text2image 跑通最小链路。
不同子命令参数细节不同
例如 image2image 用 –images，image2video 用 –image。每次提交前务必执行对应 -h 查看帮助。

作者反思：这些坑几乎每一条我都踩过一次。最大的教训是“不要把表面成功当成真正成功”——exit code 为 0 但 gen_status 失败的情况特别容易迷惑人。把这些坑提前写进 skill 规则后，Hermes 的容错能力大幅提升，也让我在后续项目中少走了很多弯路。

实用摘要 / 操作清单：一键落地检查表

[ ] 确认环境前提（Hermes、terminal、curl、Chrome）
[ ] 执行一行安装命令并验证 dreamina -h
[ ] 完成登录（推荐 –headless）并执行 dreamina user_credit
[ ] 固化 skill 规则（包含 login 检查、gen_status 判断）
[ ] 测试最小链路：text2image + –poll=30
[ ] 扩展到批量任务 + query_result + 下载
[ ] 接入分镜库实现自动排队

一页速览（One-page Summary）

核心能力：Hermes 通过即梦 CLI 实现登录、额度查询、异步生图/生视频、结果轮询与下载。
最小可用链路：安装 → 登录 → user_credit → text2image –poll → query_result。
高级玩法：接入分镜库 → 自动排队 → 整部短剧素材无人值守生成。
关键判断标准：始终以 gen_status 为成功依据，而非 exit code。
适用人群：短剧团队、AI 工作流工程师、需要批量生成素材的产品/技术人员。

FAQ

1. 即梦 CLI 是否支持 Windows 系统？
支持，从 v1.3.4 起还支持 Linux arm64。只要满足环境前提，一行安装命令即可完成。

2. headless 登录一定要安装 Google Chrome 吗？
是的，当前版本明确依赖 Google Chrome。如果无法使用，可改用手动导入登录态。

3. 任务提交后 exit code 是 0，为什么没有看到最终图片？
因为这是异步任务，exit code 0 只代表提交成功。必须通过 gen_status 或 query_result 确认生成完成。

4. 非高级会员能使用 CLI 吗？
不能，会直接报 not vip error。CLI 目前仅面向即梦高级会员开放。

5. 如何让 Hermes 自动处理多个分镜任务？
把分镜库接入 skill，先检查 user_credit，再循环提交 text2image/text2video 并记录 submit_id，最后用 query_result 批量下载。

6. Safari 登录失败怎么办？
建议切换到 Chrome 或直接使用 –headless 模式，也可添加 –debug 参数查看回调详情。

7. CLI 安装后 SKILL.md 在哪里？
位于 ~/.dreamina_cli/dreamina/SKILL.md，可作为参考手动纳入 Hermes skill 体系。

8. 整个流程最快多久能跑通最小链路？
环境准备充分的情况下，通常 10-15 分钟即可完成安装、登录、自检和第一次生图测试。

通过本文的完整步骤，你已经拥有了一条可落地、可复制、可扩展的 Hermes + 即梦 CLI 工作流。希望这些内容能真正帮到正在为素材生成效率发愁的你。实际操作中遇到任何细节问题，欢迎把具体报错信息贴出来，我们一起继续优化。