用一杯咖啡的时间,把 AI 账单算得明明白白

—— 开源工具 Fiorino.AI 入门与实践

安静又专注的办公桌

为什么你的 SaaS 需要一张“AI 账本”

过去两年,大语言模型(LLM,Large Language Model)像水电一样成了 SaaS 的标配。
你可能用 OpenAI 的 GPT-3.5 做智能客服、用 Anthropic 的 Claude 做内容生成,甚至同时接入多家模型做 A/B 测试。模型好用,但月底看到账单时,心跳往往比看到 DAU 曲线还要快:

  • 哪个用户消耗了最多 token?
  • 哪些功能把利润吃掉了?
  • 下个月到底该给客户定什么价格?

Fiorino.AI 想解决的就是这类“算不清、管不住、赚不回”的烦恼。它是一套完全开源的 AI 成本监控与自动化计费方案,把 LLM 的调用量、费用、用户、功能、订阅层级全部放进同一张实时更新的“账本”。

读完这篇文章,你会知道:

  1. Fiorino.AI 能做什么、不能做什么。
  2. 十分钟本地跑起来,并在浏览器里看到第一张成本仪表盘。
  3. 未来一年官方路线图,方便你判断要不要长期押注。

下面直接进入正题。


它到底帮你管哪些钱?

1. 按用户追踪,而不是按 API Key

很多团队把同一个 OpenAI Key 用在所有用户身上,月底只能看到一条总费用,完全不知道谁是大胃王。
Fiorino.AI 要求你在每次调用前传入一个匿名用户 ID(例如 user_123abc),系统就会:

  • 记录该用户这次用了多少 prompt token、completion token;
  • 根据当时模型的公开价 + 你自定义的加价系数,算出真实成本;
  • 把数据写进 PostgreSQL,方便后续查询。

这样既保护了用户隐私,又让运营同学可以拉出“昨日最烧钱前十名”名单。

2. 模型价格库,随时改随时生效

OpenAI 降价、Claude 出新版,官方价格表往往一夜之间全变。
Fiorino.AI 内置一张模型价格表,你可以:

  • 在线编辑每百万 token 的美元单价;
  • 增加自定义字段(例如“利润率 30%”),系统会自动把成本换算成对外售价;
  • 价格调整后,历史账单不会乱掉——每条记录都保存了当时的单价快照。

3. 自动化账单推送到 Stripe(计划中)

2025 年 Q1,官方将支持把“用户本月用了 3.47 美元”直接生成 Stripe Invoice。
如果你现在就要用,也可以自己写脚本查数据库,但官方集成能省下不少胶水代码。

4. 用量告警,防止“一夜回到解放前”

2025 年 Q1 还会上线“用量额度 + 告警”功能:

  • 给免费用户每天 5000 token,超出后自动拒绝请求;
  • 给付费用户每月 100 万 token,用完前 24 小时邮件提醒;
  • 支持宽限期、阶梯定价、包年包月抵扣等多种玩法。

十分钟本地体验

不需要写代码,只要装好 Docker。

第一步:准备数据库

Fiorino.AI 用 PostgreSQL 存数据。如果你本机没装,可以用 Docker 再起一个:

docker run -d --name fiorino-db \
  -e POSTGRES_USER=fiorino \
  -e POSTGRES_PASSWORD=fiorino \
  -e POSTGRES_DB=fiorino \
  -p 5432:5432 \
  postgres:15

第二步:启动应用

把数据库连接串填进环境变量,一行命令即可:

docker run --rm -it \
  -p 8000:8000 \
  -e DATABASE_URL="postgresql://fiorino:fiorino@host.docker.internal:5432/fiorino" \
  ghcr.io/fiorino-ai/fiorino-ai:latest

看到日志出现 Uvicorn running on http://0.0.0.0:8000 就表示成功。

第三步:打开浏览器

第一次进入仪表盘会看到“暂无数据”,下面我们手动塞一条记录试试。

第四步:发送一条调用记录

用 curl 模拟一次用户请求:

curl -X POST http://localhost:8000/api/v1/track \
  -H "Content-Type: application/json" \
  -d '{
    "user_id": "user_001",
    "model": "gpt-3.5-turbo",
    "prompt_tokens": 120,
    "completion_tokens": 80,
    "realm": "prod"
  }'

返回 {"status":"ok"} 后,刷新仪表盘就能看到:

  • 用户 user_001 产生了一次调用;
  • 总 token 200,成本约 0.0004 美元(按 0.002 美元/1K token 计算)。
简单清晰的仪表盘截图

常见疑问一次说清

Q1:匿名 ID 会不会导致查不到真实用户?

不会。系统只存储你传入的 user_id,你可以用哈希或 UUID 映射到内部账户,既合规又方便排障。

Q2:支持哪些模型?

理论上任何按 token 计费的模型都行。官方默认带了 OpenAI、Anthropic 的价目表,你也可以在后台新增“自定义模型”。

Q3:可以跑在 Kubernetes 吗?

镜像就是标准 OCI 格式,直接写 Deployment + Service 即可。数据库用 RDS 或 Cloud SQL 也很顺畅。

Q4:开源协议是什么?

MIT 许可证,可商用、可改、可闭源二次开发,只要保留版权声明即可。


未来一年官方路线图(不画饼版)

以下内容全部来自官方 ROADMAP.md,时间点是“计划”而非“承诺”。如果你准备基于 Fiorino.AI 做二次开发,建议把 GitHub Release Watch 打开,第一时间拿到进展。

时间 重点 具体功能 对业务的意义
2024 Q4 Python & TypeScript SDK 官方客户端、类型提示、示例、单测、PyPI/npm 发布 前后端接入成本降到 5 分钟
2025 Q1 计费系统 Stripe 集成、自定义定价、用量告警、额度重置 不再手写账单脚本,减少财务对账错误
2025 Q2 自定义洞察 标签系统、按功能分摊成本、可视化报表、导出 CSV 一眼看出哪个功能最烧钱,砍掉没人用却贵得离谱的按钮
2025 Q2 AI 成本分析师 自然语言查询、异常检测、成本预测 问一句“上周哪个用户异常高消费?”立刻得答案
未来 审计合规 完整审计日志、GDPR 工具、RBAC 拿到 SOC2、ISO27001 更容易
路线图便签墙

真实场景小故事

以下案例基于官方 README 描述,稍作口语化整理。

背景
一家做“AI 简历优化”的初创公司,每月 OpenAI 账单从 200 美元飙升到 2000 美元,却不知道谁在用。
做法
他们在每份简历优化请求里加了 user_id,把 Fiorino.AI 跑在同一台 ECS 上。
结果
三天后发现:

  • 5% 的免费试用用户占了 40% 的 token;
  • 其中两个用户把整本英文小说塞进来做“润色”。
    运营同学立刻给免费用户加了 5000 token/天的限制,月账单降到 800 美元,付费转化率反而提升了 12%。

如何参与社区

  1. 试用:按上面的十分钟教程跑起来。
  2. 反馈:在 GitHub 开 Issue,标签写“roadmap”或“bug”。
  3. 贡献:官方欢迎 Python/TypeScript/Go 客户端、文档、测试用例等 PR。
  4. 商业支持:如果你需要企业级 SLA、白标方案,可以发邮件到官方邮箱洽谈。

小结

Fiorino.AI 不是“又一个监控面板”,而是专门给“卖 AI 能力”的 SaaS 团队准备的账本。
它开源、轻量,十分钟就能跑起来,又能随着业务长大,逐渐接入计费、告警、洞察、审计。

如果你已经被 LLM 账单吓到过,不妨给 Fiorino.AI 一个下午的时间。
也许下一封来自财务部的邮件,就从“为什么又超预算”变成“这月利润不错,继续加投市场”。


夕阳下的代码与咖啡

– END –