用 Aiboo 让 Android 手机替你跑腿：零门槛体验 AI 语音助手

手把手教你把 Aiboo 装到手机上，并用一句话完成点餐、打车、发微博、删文件等 10 多种操作。读完你就能判断它是否值得留在主屏。

Aiboo 是什么？
它能帮你做什么？
运行原理：一句话到后台执行的全过程
5 分钟装好并开始说话
4.1 准备条件
4.2 安装步骤
4.3 第一次启动要填什么？
用 20 个场景学会下命令
5.1 点餐
5.2 打车
5.3 发微博/X
5.4 打电话、发短信
5.5 启动 App 或网页
5.6 拍照、截屏
5.7 手电筒、音量、亮度、震动
5.8 闹钟与提醒
5.9 文件增删改查
5.10 数据分析
隐私与权限：它到底访问了哪些数据？
常见疑问（FAQ）
下一步还能做什么？

1. Aiboo 是什么？

Aiboo 是一款 完全离线运行的 Android AI 助手。
用 Kotlin 写成，借助 Google Gemini 来理解你说的话，再通过 Prexocore 库把指令变成手机里的真实动作。
一句话总结：你说，它做，全程不打扰。

关键词	解释
Kotlin	Android 官方主推的现代语言，性能好、语法简洁。
Google Gemini	谷歌最新的大语言模型，负责把口语转成可执行指令。
Prexocore	作者自研的 Android 工具包，封装权限、文件、UI 等繁琐操作。

2. 它能帮你做什么？

把 README 的功能表转成“人话”：

场景	你可以这么说	它实际做的事
点外卖	“来份 200 元以内的素披萨”	在后台打开外卖 App，直接跳到披萨筛选页。
打网约车	“从 Jayanagar 到 Indiranagar 叫辆自动车”	打开打车软件并自动填好起终点。
发微博	“发一条 Tweet：今晚月亮真圆”	调用 Twitter/X 客户端，把文字贴进输入框等你确认发送。
联系朋友	“给张三打电话” 或 “发短信给李四说晚点见”	直接拨号或跳转到短信界面，内容已填好。
打开应用	“启动哔哩哔哩”	立即打开对应 App。
拍照/截屏	“拍张照片” 或 “截屏”	静默拍照或保存当前屏幕。
快捷开关	“打开手电筒”	闪光灯亮起。
闹钟提醒	“明早 7 点叫我起床健身”	通过 AlarmManager 设定系统闹钟。
文件管理	“把 Aiboo 文件夹删掉”	后台删除，无需你手动进文件管理器。
数据洞察	“分析一下最近的照片”	读取本地图片并输出简单统计，如拍摄时间分布。

所有动作都在后台运行，屏幕只弹出一句动画提示，比如“Ordering your food… 🍕”。

3. 运行原理：一句话到后台执行的全过程

为了让你放心，把技术流程拆开讲：

输入层
语音或文字先进入 Aiboo 的输入模块，默认用系统语音识别，也可以键盘打字。
理解层
Google Gemini 把自然语言拆成两部分：
- 意图（Intent）：点餐、打车、拍照……
- 参数（Slots）：披萨、200 元以内、Jayanagar → Indiranagar……
执行层
Prexocore 接手：
- 检查权限（如定位、联系人）。
- 模拟点击或调用系统 API（如 AlarmManager、MediaStore）。
- 如果该 App 有公开 DeepLink，直接用 Intent 调起页面。
反馈层
用 Lottie 动画给出一句 2 秒左右的反馈，然后安静退出。

整个过程不需要你再次点击“确认”，除非你调起的第三方 App 本身要求二次确认（如支付）。

4. 5 分钟装好并开始说话

4.1 准备条件

一台 Android 手机或模拟器，系统版本 Android 7.0 (API 24) 及以上。
Android Studio（最新版即可，仅当你想自己编译源码）。
Google Gemini API key：在 Google AI Studio 免费申请。

4.2 安装步骤

方式	步骤
直接装 APK	1. 打开 GitHub 发行页 2. 下载 `aiboo.apk` 3. 允许“安装未知来源应用”，点击安装即可。
源码自行编译	1. `git clone https://github.com/binarybeam/Aiboo.git` 2. Android Studio → Open → 选中工程 → Sync Gradle → Run。

4.3 第一次启动要填什么？

打开 Aiboo，弹出“请输入 Gemini API key”。
把 AI Studio 里复制的 key 粘进去。
可选：填入自定义模型名（留空则用默认模型）。
点击保存，主界面出现麦克风图标，即可说话。

提示：API key 只保存在本机，卸载或清除数据才会消失。

5. 用 20 个场景学会下命令

把 README 里的示例扩展成“可直接照抄”的句式，并补充你可能想知道的细节。

5.1 点餐

你这样说	背景说明
“点一份 12 英寸的玛格丽特披萨，预算 250 元以内”	支持中文或英文，金额用数字即可。
“帮我点上次那家店的黄焖鸡米饭”	如果外卖 App 支持历史订单 DeepLink，会直接跳到“再来一单”页。

5.2 打车

你这样说	背景说明
“现在从公司打车回家”	Aiboo 会读取系统“家”地址，需要你在地图 App 提前设好。
“预订明天上午 8 点去机场的经济型轿车”	部分打车 App 支持预约，Aiboo 会把时间、车型都填好。

5.3 发微博/X

你这样说	背景说明
“发推：Hello world!”	如果装了官方 Twitter App，会跳到撰写页，文字已填好；国际版系统同样适用。
“带图发博，配文字：今晚的月亮”	目前版本只把文字带过去，图片需要你手动选。

5.4 打电话、发短信

你这样说	背景说明
“打电话给妈妈”	需要通讯录里有“妈妈”这个联系人。
“发 WhatsApp 消息给张三：会议改到 3 点”	如果装了 WhatsApp，会跳到聊天窗口，文字已填好。

5.5 启动 App 或网页

你这样说	背景说明
“打开网易云音乐”	直接拉起 App；若未安装，跳到 Play 商店。
“在浏览器打开 github.com”	用默认浏览器访问。

5.6 拍照、截屏

你这样说	背景说明
“自拍一张”	调用前置摄像头，静默保存到 DCIM。
“截屏并发送到电脑”	截屏完成后可用系统分享面板手动选“发送到电脑”。

5.7 手电筒、音量、亮度、震动

你这样说	背景说明
“打开手电筒”	无需 root，直接调用系统 Torch API。
“把媒体音量调到 50%”	精确到百分比，0–100。
“亮度最低”	会暂时覆盖系统自动亮度，重启后恢复。
“震动一下”	200 ms 短震，用来测试权限是否开启。

5.8 闹钟与提醒

你这样说	背景说明
“明早 6:45 叫我起床跑步”	用 AlarmManager 设定，系统闹钟里可见。
“30 分钟后提醒我喝水”	相对时间提醒，到时弹系统通知。

5.9 文件增删改查

你这样说	背景说明
“把下载目录里的 test.zip 删掉”	直接删除，不进回收站。
“把照片重命名为 2025-08-15.jpg”	仅操作本地文件，不会同步到云端。

5.10 数据分析

你这样说	背景说明
“统计我上个月的照片数量”	读取 MediaStore，输出总数及按日分布。
“找出未命名的联系人”	查通讯录中 display name 为空的条目。

6. 隐私与权限：它到底访问了哪些数据？

权限分组	何时申请	用途
麦克风	首次使用语音输入	把你说的话转成文字。
联系人	当你说“打电话给张三”	匹配姓名与号码。
短信、通话记录	当你说“查未读短信”或“统计通话时长”	本地读取，无上传。
日历	当你说“下周哪天有空”	读取事件做冲突检测。
相机、存储	拍照、截屏或文件管理	仅保存到本机。
系统设置	调亮度、音量、手电筒	通过 Settings API 修改。

官方承诺：

API key 只存本地，无云同步。

不会偷偷上传文件或聊天记录。

每一次敏感操作由你主动语音触发。

7. 常见疑问（FAQ）

问题	回答
Q：没有谷歌服务能用吗？	A：Gemini 需联网访问谷歌服务器，但手机不必有 GMS；国内网络需自行解决科学上网。
Q：中文方言识别准确吗？	A：语音识别由系统提供，普通话效果最好，方言取决于你手机自带引擎。
Q：会不会把我通讯录上传？	A：不会。所有数据留在本地，源码公开，可自行审计。
Q：能否离线运行？	A：理解语言必须连 Gemini，其余动作纯离线。
Q：耗电厉害吗？	A：后台任务执行完立即退出，无明显耗电测试差异。
Q：可以自定义唤醒词吗？	A：当前版本无持续监听，需要点击或长按图标再说话。

8. 下一步还能做什么？

自己开发新技能：项目开源，你可以 Fork 后添加“播放指定歌单”“查快递”等指令。
贡献翻译：README 已有英语，欢迎提 PR 增加其他语言。
反馈 Bug：在 GitHub Issues 贴日志，作者一般 48 小时内回复。

小结

Aiboo 把大语言模型的“理解力”和 Android 系统 API 的“执行力”拼在一起，让你用日常口语完成原本需要 5–7 次点击的任务。
如果你已经拥有 Gemini API key，又希望手机像钢铁侠的 J.A.R.V.I.S. 一样“一句话办事”，花 5 分钟装一下，很可能就舍不得卸载了。

Aiboo安卓助手上线！一句话搞定手机操作