用一杯咖啡的时间,把 AI 账单算得明明白白
—— 开源工具 Fiorino.AI 入门与实践
为什么你的 SaaS 需要一张“AI 账本”
过去两年,大语言模型(LLM,Large Language Model)像水电一样成了 SaaS 的标配。
你可能用 OpenAI 的 GPT-3.5 做智能客服、用 Anthropic 的 Claude 做内容生成,甚至同时接入多家模型做 A/B 测试。模型好用,但月底看到账单时,心跳往往比看到 DAU 曲线还要快:
-
哪个用户消耗了最多 token? -
哪些功能把利润吃掉了? -
下个月到底该给客户定什么价格?
Fiorino.AI 想解决的就是这类“算不清、管不住、赚不回”的烦恼。它是一套完全开源的 AI 成本监控与自动化计费方案,把 LLM 的调用量、费用、用户、功能、订阅层级全部放进同一张实时更新的“账本”。
读完这篇文章,你会知道:
-
Fiorino.AI 能做什么、不能做什么。 -
十分钟本地跑起来,并在浏览器里看到第一张成本仪表盘。 -
未来一年官方路线图,方便你判断要不要长期押注。
下面直接进入正题。
它到底帮你管哪些钱?
1. 按用户追踪,而不是按 API Key
很多团队把同一个 OpenAI Key 用在所有用户身上,月底只能看到一条总费用,完全不知道谁是大胃王。
Fiorino.AI 要求你在每次调用前传入一个匿名用户 ID(例如 user_123abc
),系统就会:
-
记录该用户这次用了多少 prompt token、completion token; -
根据当时模型的公开价 + 你自定义的加价系数,算出真实成本; -
把数据写进 PostgreSQL,方便后续查询。
这样既保护了用户隐私,又让运营同学可以拉出“昨日最烧钱前十名”名单。
2. 模型价格库,随时改随时生效
OpenAI 降价、Claude 出新版,官方价格表往往一夜之间全变。
Fiorino.AI 内置一张模型价格表,你可以:
-
在线编辑每百万 token 的美元单价; -
增加自定义字段(例如“利润率 30%”),系统会自动把成本换算成对外售价; -
价格调整后,历史账单不会乱掉——每条记录都保存了当时的单价快照。
3. 自动化账单推送到 Stripe(计划中)
2025 年 Q1,官方将支持把“用户本月用了 3.47 美元”直接生成 Stripe Invoice。
如果你现在就要用,也可以自己写脚本查数据库,但官方集成能省下不少胶水代码。
4. 用量告警,防止“一夜回到解放前”
2025 年 Q1 还会上线“用量额度 + 告警”功能:
-
给免费用户每天 5000 token,超出后自动拒绝请求; -
给付费用户每月 100 万 token,用完前 24 小时邮件提醒; -
支持宽限期、阶梯定价、包年包月抵扣等多种玩法。
十分钟本地体验
不需要写代码,只要装好 Docker。
第一步:准备数据库
Fiorino.AI 用 PostgreSQL 存数据。如果你本机没装,可以用 Docker 再起一个:
docker run -d --name fiorino-db \
-e POSTGRES_USER=fiorino \
-e POSTGRES_PASSWORD=fiorino \
-e POSTGRES_DB=fiorino \
-p 5432:5432 \
postgres:15
第二步:启动应用
把数据库连接串填进环境变量,一行命令即可:
docker run --rm -it \
-p 8000:8000 \
-e DATABASE_URL="postgresql://fiorino:fiorino@host.docker.internal:5432/fiorino" \
ghcr.io/fiorino-ai/fiorino-ai:latest
看到日志出现 Uvicorn running on http://0.0.0.0:8000
就表示成功。
第三步:打开浏览器
-
仪表盘:http://localhost:8000/app -
Swagger 文档:http://localhost:8000/docs
第一次进入仪表盘会看到“暂无数据”,下面我们手动塞一条记录试试。
第四步:发送一条调用记录
用 curl 模拟一次用户请求:
curl -X POST http://localhost:8000/api/v1/track \
-H "Content-Type: application/json" \
-d '{
"user_id": "user_001",
"model": "gpt-3.5-turbo",
"prompt_tokens": 120,
"completion_tokens": 80,
"realm": "prod"
}'
返回 {"status":"ok"}
后,刷新仪表盘就能看到:
-
用户 user_001 产生了一次调用; -
总 token 200,成本约 0.0004 美元(按 0.002 美元/1K token 计算)。

常见疑问一次说清
Q1:匿名 ID 会不会导致查不到真实用户?
不会。系统只存储你传入的 user_id
,你可以用哈希或 UUID 映射到内部账户,既合规又方便排障。
Q2:支持哪些模型?
理论上任何按 token 计费的模型都行。官方默认带了 OpenAI、Anthropic 的价目表,你也可以在后台新增“自定义模型”。
Q3:可以跑在 Kubernetes 吗?
镜像就是标准 OCI 格式,直接写 Deployment + Service 即可。数据库用 RDS 或 Cloud SQL 也很顺畅。
Q4:开源协议是什么?
MIT 许可证,可商用、可改、可闭源二次开发,只要保留版权声明即可。
未来一年官方路线图(不画饼版)
以下内容全部来自官方 ROADMAP.md,时间点是“计划”而非“承诺”。如果你准备基于 Fiorino.AI 做二次开发,建议把 GitHub Release Watch 打开,第一时间拿到进展。
时间 | 重点 | 具体功能 | 对业务的意义 |
---|---|---|---|
2024 Q4 | Python & TypeScript SDK | 官方客户端、类型提示、示例、单测、PyPI/npm 发布 | 前后端接入成本降到 5 分钟 |
2025 Q1 | 计费系统 | Stripe 集成、自定义定价、用量告警、额度重置 | 不再手写账单脚本,减少财务对账错误 |
2025 Q2 | 自定义洞察 | 标签系统、按功能分摊成本、可视化报表、导出 CSV | 一眼看出哪个功能最烧钱,砍掉没人用却贵得离谱的按钮 |
2025 Q2 | AI 成本分析师 | 自然语言查询、异常检测、成本预测 | 问一句“上周哪个用户异常高消费?”立刻得答案 |
未来 | 审计合规 | 完整审计日志、GDPR 工具、RBAC | 拿到 SOC2、ISO27001 更容易 |
真实场景小故事
以下案例基于官方 README 描述,稍作口语化整理。
背景
一家做“AI 简历优化”的初创公司,每月 OpenAI 账单从 200 美元飙升到 2000 美元,却不知道谁在用。
做法
他们在每份简历优化请求里加了 user_id
,把 Fiorino.AI 跑在同一台 ECS 上。
结果
三天后发现:
-
5% 的免费试用用户占了 40% 的 token; -
其中两个用户把整本英文小说塞进来做“润色”。
运营同学立刻给免费用户加了 5000 token/天的限制,月账单降到 800 美元,付费转化率反而提升了 12%。
如何参与社区
-
试用:按上面的十分钟教程跑起来。 -
反馈:在 GitHub 开 Issue,标签写“roadmap”或“bug”。 -
贡献:官方欢迎 Python/TypeScript/Go 客户端、文档、测试用例等 PR。 -
商业支持:如果你需要企业级 SLA、白标方案,可以发邮件到官方邮箱洽谈。
小结
Fiorino.AI 不是“又一个监控面板”,而是专门给“卖 AI 能力”的 SaaS 团队准备的账本。
它开源、轻量,十分钟就能跑起来,又能随着业务长大,逐渐接入计费、告警、洞察、审计。
如果你已经被 LLM 账单吓到过,不妨给 Fiorino.AI 一个下午的时间。
也许下一封来自财务部的邮件,就从“为什么又超预算”变成“这月利润不错,继续加投市场”。
– END –