🍌 Banana Slides:让想法自然流动成一份完整的 PPT
—— 一个更接近真实创作方式的 AI 演示文稿生成工具
很多人制作 PPT 的困境并不是“不懂设计”,而是“没有时间”。
脑子里有内容,知道要讲什么,但真正打开软件时,往往被排版、找图、调颜色、做结构这些步骤消耗掉大半精力。
Banana Slides 想做的事很简单:
让 PPT 从“排版工作”回归到“表达工作”。
它基于 nano banana pro 🍌 模型,对图文页面有更强的理解和生成能力。你输入一句话、一段大纲,甚至一组描述,它就能自动生成结构清晰、风格统一、可直接用于展示的 PPT 页面图像,并支持持续修改、添加素材、重构大纲,让创作像聊天一样自然。
接下来,我们将以一个更接近真实阅读体验的方式,带你完整了解这个项目的用途、功能、结构与部署方式。
目录
-
为什么需要一个这样的工具 -
Banana Slides 能在哪些场景帮助你 -
生成效果展示 -
功能与亮点解析 -
创建方式:从想法到具体页面 -
文件解析能力 -
导出格式 -
如何使用(Docker / 源码部署) -
技术架构全景图 -
项目结构解析 -
常见问题 FAQ -
如何贡献
为什么需要一个这样的工具
很多 AI PPT 生成工具已经宣称可以“一键出 PPT”。
但使用后你大概会有以下一些真实体验:
-
模板多,但每个模板的限制更大 -
内容修改一处,整体结构容易被破坏 -
想精修某一页,却发现 AI 每次都“重做一遍” -
页面看起来像是“AI 常见风格”,而不是你想要的设计 -
导出的 PPT 不太适合继续编辑
这些问题的核心是:
“
工具把“内容创作”和“格式生产”绑在一起,而不是解耦。
Banana Slides 的思路则是:
-
内容 → 交给 LLM 做结构化 -
设计 → 交给图像生成模型完成 -
修改 → 让用户以自然语言调整 -
素材 → 允许任意上传与引用 -
导出 → 输出 PPTX / PDF,可直接用于工作场景
这样,你能得到一个更像“真实创作过程”的工具,而不是一个只能生成模板化 PPT 的流水线。
Banana Slides 能在哪些场景帮助你
以下描述均来自原文件,但我们会以更贴近用户思考方式的方式呈现。
🐣 1. 初学者:不用懂设计也能产出好作品
如果你只是偶尔做 PPT,不熟悉字体、排版、视觉比例等知识,那么一句话描述主题,工具即可自动生成结构与页面。
👔 2. 专业 PPT 设计师:提升灵感效率
它生成的封面、排版、图文比例很适合作为灵感参考。你可以上传自己的模板或素材,让页面风格与你的习惯一致。
👨🏫 3. 教育场景:快速生成教学页
教师可以把课程内容、文档、截图统一丢进系统,一套教学 PPT 很快就能成型。
📖 4. 学生:节省排版时间
作业展示、研究汇报如果时间紧,用 Banana Slides 可以把重点放在“内容思考”,而不是“做得好不好看”。
💼 5. 职场用户:提高效率
产品介绍、项目汇报、方案展示,输入大纲即可得到结构清晰、风格统一的页面。
生成效果展示
以下为原文件中的示例图,我们保留其呈现方式:
页面观感保持了结构性、主题一致性、配图质量较高,这是 nano banana pro 模型的特点之一。
功能与亮点解析
项目原文有一段完整列表,我们在保持信息不变的前提下,用更自然的方式解释。
🍌 1. 用一句话生成 PPT
不需要写完整大纲,你可以输入:
“
“我想做一个介绍新能源车基础知识的 PPT。”
工具会自动生成:
-
大纲 -
每页描述 -
页面图像
这极大降低了启动成本,尤其是在赶时间时。
🔄 2. 三条路径:想法、大纲、描述
不同用户有不同习惯,所以工具提供三个入口:
-
从想法开始:一句话即可 -
从大纲开始:适合有内容但需要页面结构的用户 -
从逐页描述开始:适合精确控制内容的人
🔍 3. 文本解析:抓取重点与图片
输入的文本里如果包含 Markdown 图片或链接,它会自动提取并使用。
对于需要从文章中提取关键点做 PPT 的场景特别实用。
🔗 4. 文件上传解析
支持:pdf / doc / docx / md / txt
解析内容包括:
-
文本 -
图片 -
图表说明
这些都能作为后续 PPT 生成的依据。
🧾 5. 上传任意素材
你可以上传:
-
图片 -
旧 PPT 截图 -
手绘草稿 -
风格参考图 -
页面布局示例
AI 会根据这些素材进行风格或布局引导。
🧙♀️ 6. AI 辅助编排
由 LLM 自动生成:
-
PPT 的逻辑结构 -
内容框架 -
每页要点
你可以逐页修改,而不是一次性全改。
🖼️ 7. 高质量图像生成
基于 nano banana pro 🍌 ,呈现:
-
风格一致 -
字体可读 -
布局统一 -
色彩协调
这是传统 AI PPT 工具少见的稳定性优势。
🎙️ 8. 自然语言修改
你可以直接对系统说:
“
“把第 3 页的背景换成深色,并让标题更突出。”
系统会自动重新生成该页。
📊 9. 一键导出
支持:
-
PPTX(可继续编辑) -
PDF(适合展示/分享)
默认比例 16:9,更符合日常使用习惯。
创建方式:从想法到具体页面
这一部分来自原文,但用更友好的方式解释。
1. 从构想生成
输入一句话 → 自动生成大纲 → 生成每页描述 → 输出页面图像。
非常适合快速开工。
2. 从大纲生成
你可以粘贴已有大纲,例如课程、报告、方案,然后让系统自动扩展成多页描述。
3. 从描述生成
如果你对内容结构已经很明确,直接输入每页要呈现的内容。
文件解析能力
这一能力让 Banana Slides 与传统工具明显不同。
它支持上传:
-
PDF -
Word(doc、docx) -
Markdown -
TXT
解析方式:
-
文本 → 抽取段落、标题、要点 -
图片 → 分离、识别、生成描述
解析完成后,这些内容可作为 PPT 的生成素材。
导出格式
支持两种:
不需要额外设置即可使用。
如何使用(Docker / 源码部署)
原文件提供两种部署方式:Docker Compose 与源码方式。
以下内容完全基于原文,但用更适合操作的方式写出。
使用 Docker Compose(推荐)
如果你想最省时间,这是最简单的方法。
0. 克隆代码仓库
git clone https://github.com/Anionex/banana-slides
cd banana-slides
1. 创建 .env
cp env.example .env
编辑 .env:
GOOGLE_API_KEY=your-google-api-key-here
GOOGLE_API_BASE=https://generativelanguage.googleapis.com
2. 启动服务
docker compose up -d
3. 访问前后端
4. 查看日志
docker compose logs -f
docker compose logs -f backend
docker compose logs -f frontend
5. 停止服务
docker compose down
从源码部署
包含后端(Python + Flask)与前端(React)。
环境要求
-
Python 3.10+ -
uv 包管理器 -
Node.js 16+ -
有效的 Google Gemini API Key
后端部署步骤
0. 克隆仓库
git clone https://github.com/Anionex/banana-slides
cd banana-slides
1. 安装 uv
curl -LsSf https://astral.sh/uv/install.sh | sh
2. 安装依赖
uv sync
3. 创建 .env
cp .env.example .env
编辑其中的必要字段:
GOOGLE_API_KEY=your-api-key-here
GOOGLE_API_BASE=https://generativelanguage.googleapis.com
PORT=5000
4. 启动后端
cd backend
uv run python app.py
访问:
http://localhost:5000/health
前端部署步骤
1. 进入目录
cd frontend
2. 安装依赖
npm install
3. 启动开发服务器
npm run dev
前端默认连接至后端 http://localhost:5000。
技术架构全景图
这部分内容来自原文件,但我们用更易理解的方式呈现。
前端技术栈
-
React 18 -
TypeScript -
Vite 5 -
Zustand -
React Router v6 -
Tailwind CSS -
dnd-kit -
Lucide React -
Axios
特点:轻量、响应快、开发体验好。
后端技术栈
-
Python 3.10+ -
Flask 3.0 -
SQLite -
Google Gemini API -
python-pptx -
Pillow -
ThreadPoolExecutor
核心职责:
-
处理 AI 请求 -
解析文件 -
生成 PPTX / PDF -
管理异步任务
项目结构
原文提供了清晰结构,我们以更易读方式呈现:
banana-slides/
├── frontend/ # React 前端
│ ├── pages/ # 页面
│ ├── components/ # UI 组件
│ ├── store/ # Zustand 状态
│ ├── api/ # API 客户端
│ └── utils/
│
├── backend/ # Flask 后端
│ ├── models/ # 数据库模型
│ ├── services/ # AI/文件/PPT 服务
│ ├── controllers/ # 接口路由
│ └── utils/
│
├── uploads/ # 上传目录(自动生成)
├── demo.py
├── gemini_genai.py
├── docker-compose.yml
└── README.md
常见问题 FAQ
以下内容基于原文件信息,结合实际用户可能提出的提问。
1. 生成的 PPT 能继续修改吗?
可以。
导出的文件是 标准 PPTX 格式,可在 PowerPoint 中继续编辑。
2. 图片风格能保持统一吗?
是的。
nano banana pro 🍌 在风格一致性方面表现稳定,每一页的颜色、布局、质感较为协调。
3. 如果我对某一页不满意,可以只修改那一页吗?
可以。
系统支持“自然语言修改单页”,例如:
“
“调整第 5 页,让标题更简洁。”
4. 我可以上传自己的素材作为风格参考吗?
可以。
上传任何图片、截图、旧 PPT 都可以作为提示。系统会根据参考素材调整生成内容。
5. 文件解析是否支持 PDF 内的图片?
支持。
PDF 内的文本与图片都会被提取并结构化处理。
6. 项目是否可以在普通服务器上运行?
可以。
依赖:Python + Node.js + 有效的 Gemini API Key
使用 Docker 则部署更简易。
如何贡献
项目开放:
-
Issue -
Pull Request
任何功能建议、bug 修复、文档改进都非常欢迎。
结语
Banana Slides 更像是一个“创作助理”,不是一个生成模板的工具。
它把 PPT 的创作拆分成三个阶段:
-
内容结构 -
图文呈现 -
自然调整
通过这三个阶段,它试图让表达变得更自然,让每个人都能把自己的想法以合适的方式呈现出来。
如果你正在寻找一个能真正帮你“减少 PPT 制作时间”的工具,它值得尝试。

