把“熵增定律”“冒泡排序”这些抽象词一键变成动画:Fogsight 本地部署全流程与使用指南
一、为什么需要“雾象”?
问题 | 传统做法 | 雾象的新思路 |
---|---|---|
把一个概念讲清楚 | 做 PPT、录屏、手绘分镜,至少 2-3 天 | 输入词语,10-20 分钟自动生成带双语旁白的动画 |
修改细节 | 重新渲染、重新配音 | 用自然语言跟 AI 对话,实时微调画面、旁白、节奏 |
技术门槛 | 需要掌握 After Effects、Premiere、脚本语言 | 一台笔记本 + 浏览器即可 |
一句话总结:雾象(Fogsight)把“写 prompt”变成了“导演”,让任何人都能用一句话做出电影级小短片。
二、三分钟看懂“雾象”能做什么
1. 典型场景
-
教师:把“欧拉定理”变成 30 秒动画,嵌入慕课。 -
科普作者:用“熵增定律”动画解释热力学第二定律,B 站 10 万播放。 -
产品经理:用“可供性”动画向客户展示交互逻辑,节省 50 % 会议时间。
2. 已公开的 4 个示例
输入词语 | 学科 | 动画时长 | 观看地址 |
---|---|---|---|
熵增定律 | 物理 | 50 秒 | B 站 BV1PXgKzBEyN |
欧拉定理 | 数学 | 45 秒 | B 站 BV1yXgKzqE42 |
冒泡排序 | 计算机 | 60 秒 | B 站 BV1sQgKzMEox |
affordance in design | 设计学 | 55 秒 | B 站 BV1yQgKzMEo6 |
所有示例都包含英/中双语旁白,可直接嵌入课堂或社媒。
三、技术原理(非技术读者可跳过)
雾象由三层组成:
-
大语言模型(LLM)——理解你的输入,把抽象概念拆成“镜头脚本 + 旁白”。 -
动画编排引擎——把脚本映射成视觉元素、转场、音效。 -
语言用户界面(LUI)——让你像聊天一样继续修改,“把第二幕换成暖色调”一句话生效。
四、本地部署:从零到第一次生成动画
以下步骤在 macOS 14 / Ubuntu 22 / Windows 11 均验证通过。遇到报错先看 FAQ。
1. 硬件与系统
-
Python 3.9 及以上 -
8 GB 内存即可运行(生成 720p 动画约 5-10 分钟) -
现代浏览器(Chrome 120+ / Firefox 121+ / Edge 120+)
2. 获取代码
git clone https://github.com/fogsightai/fogsight.git
cd fogsight
3. 安装依赖
pip install -r requirements.txt
如果提示
pip
版本过低,先pip install -U pip
。
4. 配置 API 密钥
cp demo-credentials.json credentials.json
# 用文本编辑器打开 credentials.json
# 填入两项:
# "API_KEY": "你的 Gemini 2.5 pro 密钥",
# "BASE_URL": "https://generativelanguage.googleapis.com/v1beta/openai/"
-
为什么用 Gemini 2.5 pro?
实测在脚本生成、双语旁白上幻觉最少。 -
如果只有 OpenAI 兼容接口,把 BASE_URL
换成对应地址即可。
5. 一键启动
python start_fogsight.py
终端会看到:
[INFO] Backend started at http://127.0.0.1:8000
Opening browser...
浏览器自动弹出本地页面。
五、第一次生成动画:以“冒泡排序”为例
Step 1:输入主题
在文本框输入:
冒泡排序
Step 2:点击“生成”
-
进度条:脚本 → 分镜 → 配音 → 合成 -
720p 动画约 5-8 分钟,1080p 约 10-15 分钟(取决于显卡)
Step 3:预览与对话修改
假设你觉得“第三遍循环节奏太快”:
在对话框输入:
把第三遍循环的间隔拉长 0.5 秒,并把背景色换成淡蓝色。
AI 会:
-
重新渲染第三幕 -
保持其余镜头不变 -
30 秒内给出新版本
六、常见问题(FAQ)
你可能的疑问 | 直接回答 |
---|---|
它对中文支持好吗? | 完全支持,旁白可选中文、英文或双语。 |
生成速度为什么这么慢? | 第一次冷启动需下载模型权重;后续同一主题复用缓存可提速 3-4 倍。 |
能否离线运行? | 目前 LLM 仍需联网调用;本地仅做渲染与缓存。 |
输出的视频格式? | MP4(H.264),720p/1080p 可选,码率 8 Mbps。 |
商用授权? | MIT 许可证,可商用;引用时注明项目链接即可。 |
电脑没显卡能跑吗? | 可以,CPU 渲染 720p 约 15 分钟;有 RTX 3060 以上会快 4-5 倍。 |
如何加入交流群? | 点击飞书文档底部的“加入群聊”。 |
七、进阶技巧:让动画更出彩
1. 输入 prompt 的 3 个小窍门
-
加学科关键词:输入“欧拉定理 数学 多面体”比单独“欧拉定理”镜头更精准。 -
指定时长:输入“30 秒短视频”或“90 秒详细版”控制节奏。 -
语言标记:输入“双语旁白”或“纯英文”避免二次修改。
2. LUI 对话模板
目的 | 可直接复制粘贴的话 |
---|---|
换色调 | 把整体色调换成赛博朋克风格,主色 #00ffff 和 #ff00ff。 |
加字幕 | 在底部加白色黑边字幕,字号 48,居中。 |
调整节奏 | 把第二幕延长 2 秒,并在转场加淡入淡出。 |
换配音 | 旁白换成温柔女声,语速放慢 0.8 倍。 |
八、幕后团队与致谢
雾象是 WaytoAGI 开源计划成员,核心贡献者来自高校、社区与独立开发者:
-
高校:香港中文大学(深圳)、南洋理工大学 -
WaytoAGI 社区:陈财猫、kk -
Index Future Lab:何淋 -
AI 探索家:黄小刀 -
独立开发者:shuyan-5200、王如玥、Jack-the-Builder、xiayurain95、蔡李鑫
感谢每一位在飞书群反馈 bug 与建议的朋友。
九、下一步计划
-
开放插件系统:允许用户上传自定义视觉素材。 -
本地模型微调脚本:在 8 GB 显存显卡上跑 7B 模型,实现离线生成。 -
社区模板库:一键复用他人做好的“费马小定理”“快速排序”等模板。
十、小结与行动号召
现在你已经知道:
-
雾象能把抽象概念秒变动画 -
本地部署只需 5 条命令 -
用自然语言就能迭代镜头
下一步,打开终端,输入:
git clone https://github.com/fogsightai/fogsight.git
10 分钟后,你就能把“薛定谔的猫”变成一部 45 秒的趣味短片。
欢迎把作品分享到飞书群,一起把知识可视化做到极致。