Hermes 接入即梦 CLI 完整教程:实现自动生图与生视频,解放重复劳动
本文欲回答的核心问题:作为专科及以上学历的技术、产品或工程类读者,如何基于即梦 CLI 将 Hermes 接入,实现自动提交生图、生视频任务、查询结果并接入工作流,从而让短剧团队等场景下的重复劳动被彻底解放?
即梦的 Seedance 2.0 目前只能同时提交 10 个任务,许多短剧团队为了避开高峰期,甚至选择凌晨开工或通宵盯任务。接入即梦 CLI 之后,Hermes 可以代替人工完成传递提示词、等待任务、检查结果等重复操作。更进一步,如果把分镜库接入进来,就能实现自动排队——睡一觉醒来,整部短剧的镜头素材就全部生成好了。
本文将完整整理操作步骤与踩过的所有坑。如果你正准备配置,可以直接把这篇教程发给 Hermes,让它按步骤执行,省去自己一步步调试(OpenClaw 同样适用)。完成配置后,你的 Hermes 至少能做到调用即梦 CLI、检查登录状态、查询额度、提交生图或生视频任务、查询异步任务结果,并将结果无缝接入后续工作流。
前提说明:即梦 CLI 目前仅面向即梦高级会员开放,高级会员可享受生图免费权益。
以下是 Hermes 实际生成图片与视频并回传的演示效果:
0:01 / 0:13
(演示中 Hermes 已自动完成提示词提交、任务轮询并返回结果)
环境前提:开始接入前必须确认哪些硬件和软件条件?
本节欲回答的核心问题:在安装即梦 CLI 并接入 Hermes 之前,到底需要准备哪些最基础的环境,才能保证后续每一步都顺利跑通?
即梦 CLI 支持 Linux、macOS、Windows 系统(从 v1.3.4 版本起正式支持 Linux arm64)。在动手之前,请先逐一确认以下几点:
-
Hermes 已可正常运行; -
Hermes 具备 terminal 执行能力; -
终端环境中可正常运行 curl 或 wget 命令; -
如果计划使用 headless 登录方式(Agent 场景下强烈推荐),机器上必须安装 Google Chrome; -
如果选择本地浏览器登录方式,机器上需有可正常启动的默认浏览器。
这些条件看似基础,却直接决定后续登录和任务提交能否成功。很多人在这一步就卡住,是因为忽略了 headless 模式对 Chrome 的依赖,或者终端缺少 curl 支持。确认这些前提后,再进入安装环节,就能避免走弯路。
作者反思:我第一次配置时,就是因为没提前检查 Chrome 是否可用,直接跳到 headless 登录,结果卡了半天。后来回头看环境前提,才真正理解“每一步都建立在前一步可靠之上”这个道理。这也是为什么我把环境检查放在最前面——它不是可有可无的 checklist,而是整条链路的根基。
安装与验证 CLI:如何一行命令完成安装并快速确认可用?
本节欲回答的核心问题:即梦 CLI 该如何安装?安装完成后又该用什么命令验证它真正可用,而不是仅仅“看起来装好了”?
官方提供了一行安装命令,操作极其简便:
curl -fsSL https://jimeng.jianying.com/cli | bash
这条命令会自动下载 CLI 二进制文件、version.json,并尝试将安装目录写入 PATH。同时,SKILL.md 文件会被下载到 ~/.dreamina_cli/dreamina/SKILL.md 目录下。请注意:这个 SKILL.md 只是本地下载,并不会自动安装进 Hermes 的 skills 目录,需要后续手动纳入。
安装完成后,立即进行验证:
which dreamina
dreamina -h
如果命令正常返回路径,并且 dreamina -h 显示出以下子命令列表,就说明 CLI 本体安装成功:
-
login / relogin / logout —— 登录管理 -
user_credit —— 查询额度 -
text2image / text2video —— 文生图、文生视频 -
image2image / image2video —— 图生图、图生视频 -
multiframe2video / multimodal2video —— 多帧/多模态生视频 -
query_result —— 查询异步任务结果 -
list_task —— 查看历史任务
应用场景说明:假设你是一位短剧制作工程师,每天需要批量生成几十个镜头。CLI 安装验证通过后,你就可以让 Hermes 直接调用这些子命令,而不再手动打开网页一个个提交。这一步验证非常关键——它不是形式主义,而是确保后续所有自动化脚本都能基于可靠的 CLI 运行。
作者反思:我曾以为“安装完就万事大吉”,结果 dreamina -h 能跑却登录失败。后来才明白,验证 CLI 可用必须看子命令列表完整性。这次教训让我养成“每装一个工具都立即验证 help”的习惯,也让 Hermes 的自动化流程更稳健。
登录:如何选择最适合 Hermes 的登录方式并快速自检?
本节欲回答的核心问题:即梦 CLI 的登录环节有哪些方式?在 Hermes 或 Agent 场景下,哪种方式最高效,且如何立即确认登录状态真正生效?
手动登录最简单,直接执行:
dreamina login
CLI 会自动拉起默认浏览器,引导完成授权流程。
如果是 Hermes / Agent 场景,推荐使用 headless 模式:
dreamina login --headless
当前版本明确要求 –headless 依赖 Google Chrome。如果机器无法使用 Chrome 或浏览器拉起失败,也支持手动导入登录态,按照指引一步步完成即可。
遇到浏览器未能自动拉起或登录过程卡住的情况,可添加 –debug 参数重试:
dreamina login --debug
此模式会在终端打印回调地址和详细调试信息,帮助快速定位问题。
登录成功后,立即执行自检命令:
dreamina user_credit
如果终端返回包含余额信息的 JSON 数据,说明登录状态和环境配置全部生效,可以正式开始提交生成任务。
场景化说明:短剧团队凌晨批量生成素材时,使用 headless 登录能让 Hermes 在无人值守环境下自动完成授权,避免每次都手动干预浏览器。这正是“睡一觉素材就生成好”的关键前提。
作者反思:我最初尝试 Safari 登录,结果遇到回调异常。后来改用 Chrome + headless 模式,一次成功。这让我深刻体会到“工具的兼容性往往藏在小细节里”——选择对的登录方式,不是多此一举,而是决定整个流程能否真正无人值守。
核心命令用法:生图、生视频、查询结果的完整参数与实际操作示例
本节欲回答的核心问题:即梦 CLI 最常用的生图、生视频命令到底该怎么写?每个命令的关键参数是什么?如何结合 –poll 实现自动化等待,并把结果直接接入工作流?
所有任务提交命令都支持通用参数 --poll=<秒数>(例如 --poll=30)。加入此参数后,CLI 会在提交后以每秒 1 次的频率轮询任务状态,最长等待指定秒数。如果等待时间内任务完成,会直接在终端输出最终结果;如果超时,则返回 querying 状态的中间结果,后续可通过 query_result 命令继续查询。
1. 文生图(text2image)
dreamina text2image \
--prompt="一只戴墨镜的橘猫" \
--ratio=1:1 \
--resolution_type=2k \
--poll=30
场景:短剧开场镜头需要一个卡通风格的角色形象,Hermes 可直接用这条命令生成 2K 分辨率的正方形图片,30 秒内完成轮询并返回结果。
2. 文生视频(text2video)
dreamina text2video \
--prompt="镜头推进,一只橘猫从沙发上跳下来" \
--duration=5 \
--ratio=16:9 \
--video_resolution=720P \
--poll=30
场景:短剧中需要一段 5 秒的动态镜头,Hermes 提交后可自动等待生成 720P 横版视频,完成后直接回传给后续剪辑流程。
3. 图生图(image2image)
dreamina image2image \
--images ./input.png \
--prompt="改成水彩风格" \
--resolution_type=2k \
--poll=30
注意:–images 参数必须指向本地图片文件路径。
场景:已有角色草图,想快速迭代成水彩风格用于分镜预览,Hermes 可自动完成风格转换并返回 2K 结果。
4. 图生视频(image2video)
dreamina image2video \
--image ./first_frame.png \
--prompt="镜头慢慢推近" \
--duration=5 \
--poll=30
注意:–image 参数(单数)指向本地首帧图片。
场景:短剧中已有第一帧静态图,需要生成推镜头动态视频,Hermes 可直接把静态输入转化为 5 秒视频素材。
5. 查询异步任务结果(query_result)
如果未使用 –poll 或轮询超时,命令会返回 submit_id。使用以下方式查询:
# 基础查询
dreamina query_result --submit_id=<你的_submit_id>
# 查询并直接下载到指定目录
dreamina query_result --submit_id=<你的_submit_id> --download_dir=./downloads
场景:批量生成 10 个任务后,Hermes 可记录每个 submit_id,定时查询并把成功结果自动下载到工作目录,供下一步剪辑使用。
6. 查看历史任务(list_task)
# 查看所有任务
dreamina list_task
# 仅查看成功的任务
dreamina list_task --gen_status=success
# 根据 submit_id 筛选
dreamina list_task --submit_id=<你的_submit_id>
场景:项目复盘时,Hermes 可快速列出当天所有成功素材,方便团队审查哪些提示词效果最好。
作者反思:我发现不同子命令的参数细节差异很大(比如 image2image 用 –images 复数,image2video 用 –image 单数),每次提交前先运行对应 -h 命令已成为习惯。这看似小事,却避免了 80% 的语法错误,也让 Hermes 的自动化脚本更健壮。
接入 Hermes:如何把 CLI 固化成 skill,实现真正无人值守的工作流?
本节欲回答的核心问题:CLI 安装登录完成后,如何让 Hermes 真正“懂”这些命令,并把整个流程封装成可重复使用的 skill?
如果 Hermes 与 CLI 安装在同一台机器,最简单的验证方式是让 Hermes 依次执行以下三条命令:
dreamina -h
dreamina user_credit
dreamina text2image --prompt="一只戴墨镜的橘猫" --ratio=1:1 --resolution_type=2k --poll=30
三条全部跑通,就意味着 Hermes 已能正常调用即梦 CLI。
为了长期使用,建议把流程固化成 Hermes skill。安装时已自动下载官方 SKILL.md(位于 ~/.dreamina_cli/dreamina/SKILL.md),可作为参考模板。skill 至少应包含以下规则:
-
先执行 dreamina -h确认 CLI 可用; -
先执行 dreamina user_credit确认登录态和余额; -
提交任务时必须记录 submit_id; -
查询结果时以 gen_status 为准判断成功; -
失败时读取 fail_reason 获取具体原因; -
不要仅依赖 exit code 判断任务是否成功。
场景化价值:接入分镜库后,Hermes 可自动读取下一条分镜提示词、提交任务、等待结果、下载素材并推送到剪辑软件,整部短剧素材生成过程实现全自动。团队再也不需要通宵盯任务,效率直接提升几个量级。
作者反思:把 CLI 接入 skill 的过程,让我真正感受到“工具赋能”的力量。最初只是为了省几分钟重复操作,后来却演变成整条生产线的自动化。这也提醒我:任何技术接入,都要从“先跑通最小链路”开始,再逐步扩展复杂度。
踩坑记录:哪些常见问题最容易导致失败?如何提前规避?
本节欲回答的核心问题:接入即梦 CLI 和 Hermes 时,最容易踩的坑有哪些?实际操作中该如何判断和解决?
以下是实际踩过的所有坑及对应解决方法:
-
dreamina -h 能跑 ≠ 真正可用
只能说明 CLI 安装成功,不代表登录态和账号正常。必须先完成 login + user_credit 才能确认。 -
需要高级会员权限
非高级会员账号会直接报 not vip error。CLI 目前仅面向即梦高级会员开放。 -
exit code=0 ≠ 生成成功
异步任务中,命令返回 0 仅表示“提交成功”,并非“生成完成”。必须检查 gen_status 字段。 -
Safari 登录可能存在兼容性问题
部分用户反馈 Safari 会出现回调异常。建议优先使用 Chrome,或直接切换到 –headless / 手动导入方案。 -
先测图片,再测视频
视频链路参数更多、耗时更长,不适合作为第一步验证。建议先用 text2image 跑通最小链路。 -
不同子命令参数细节不同
例如 image2image 用 –images,image2video 用 –image。每次提交前务必执行对应-h查看帮助。
作者反思:这些坑几乎每一条我都踩过一次。最大的教训是“不要把表面成功当成真正成功”——exit code 为 0 但 gen_status 失败的情况特别容易迷惑人。把这些坑提前写进 skill 规则后,Hermes 的容错能力大幅提升,也让我在后续项目中少走了很多弯路。
实用摘要 / 操作清单:一键落地检查表
-
[ ] 确认环境前提(Hermes、terminal、curl、Chrome) -
[ ] 执行一行安装命令并验证 dreamina -h -
[ ] 完成登录(推荐 –headless)并执行 dreamina user_credit -
[ ] 固化 skill 规则(包含 login 检查、gen_status 判断) -
[ ] 测试最小链路:text2image + –poll=30 -
[ ] 扩展到批量任务 + query_result + 下载 -
[ ] 接入分镜库实现自动排队
一页速览(One-page Summary)
核心能力:Hermes 通过即梦 CLI 实现登录、额度查询、异步生图/生视频、结果轮询与下载。
最小可用链路:安装 → 登录 → user_credit → text2image –poll → query_result。
高级玩法:接入分镜库 → 自动排队 → 整部短剧素材无人值守生成。
关键判断标准:始终以 gen_status 为成功依据,而非 exit code。
适用人群:短剧团队、AI 工作流工程师、需要批量生成素材的产品/技术人员。
FAQ
1. 即梦 CLI 是否支持 Windows 系统?
支持,从 v1.3.4 起还支持 Linux arm64。只要满足环境前提,一行安装命令即可完成。
2. headless 登录一定要安装 Google Chrome 吗?
是的,当前版本明确依赖 Google Chrome。如果无法使用,可改用手动导入登录态。
3. 任务提交后 exit code 是 0,为什么没有看到最终图片?
因为这是异步任务,exit code 0 只代表提交成功。必须通过 gen_status 或 query_result 确认生成完成。
4. 非高级会员能使用 CLI 吗?
不能,会直接报 not vip error。CLI 目前仅面向即梦高级会员开放。
5. 如何让 Hermes 自动处理多个分镜任务?
把分镜库接入 skill,先检查 user_credit,再循环提交 text2image/text2video 并记录 submit_id,最后用 query_result 批量下载。
6. Safari 登录失败怎么办?
建议切换到 Chrome 或直接使用 –headless 模式,也可添加 –debug 参数查看回调详情。
7. CLI 安装后 SKILL.md 在哪里?
位于 ~/.dreamina_cli/dreamina/SKILL.md,可作为参考手动纳入 Hermes skill 体系。
8. 整个流程最快多久能跑通最小链路?
环境准备充分的情况下,通常 10-15 分钟即可完成安装、登录、自检和第一次生图测试。
通过本文的完整步骤,你已经拥有了一条可落地、可复制、可扩展的 Hermes + 即梦 CLI 工作流。希望这些内容能真正帮到正在为素材生成效率发愁的你。实际操作中遇到任何细节问题,欢迎把具体报错信息贴出来,我们一起继续优化。
