用 Aiboo 让 Android 手机替你跑腿:零门槛体验 AI 语音助手
手把手教你把 Aiboo 装到手机上,并用一句话完成点餐、打车、发微博、删文件等 10 多种操作。读完你就能判断它是否值得留在主屏。
目录
5 分钟装好并开始说话
4.1 准备条件
4.2 安装步骤
4.3 第一次启动要填什么?
用 20 个场景学会下命令
5.1 点餐
5.2 打车
5.3 发微博/X
5.4 打电话、发短信
5.5 启动 App 或网页
5.6 拍照、截屏
5.7 手电筒、音量、亮度、震动
5.8 闹钟与提醒
5.9 文件增删改查
5.10 数据分析
1. Aiboo 是什么?
Aiboo 是一款 完全离线运行的 Android AI 助手 。
用 Kotlin 写成,借助 Google Gemini 来理解你说的话,再通过 Prexocore 库把指令变成手机里的真实动作。
一句话总结:你说,它做,全程不打扰 。
关键词
解释
Kotlin
Android 官方主推的现代语言,性能好、语法简洁。
Google Gemini
谷歌最新的大语言模型,负责把口语转成可执行指令。
Prexocore
作者自研的 Android 工具包,封装权限、文件、UI 等繁琐操作。
2. 它能帮你做什么?
把 README 的功能表转成“人话”:
场景
你可以这么说
它实际做的事
点外卖
“来份 200 元以内的素披萨”
在后台打开外卖 App,直接跳到披萨筛选页。
打网约车
“从 Jayanagar 到 Indiranagar 叫辆自动车”
打开打车软件并自动填好起终点。
发微博
“发一条 Tweet:今晚月亮真圆”
调用 Twitter/X 客户端,把文字贴进输入框等你确认发送。
联系朋友
“给张三打电话” 或 “发短信给李四说晚点见”
直接拨号或跳转到短信界面,内容已填好。
打开应用
“启动哔哩哔哩”
立即打开对应 App。
拍照/截屏
“拍张照片” 或 “截屏”
静默拍照或保存当前屏幕。
快捷开关
“打开手电筒”
闪光灯亮起。
闹钟提醒
“明早 7 点叫我起床健身”
通过 AlarmManager 设定系统闹钟。
文件管理
“把 Aiboo 文件夹删掉”
后台删除,无需你手动进文件管理器。
数据洞察
“分析一下最近的照片”
读取本地图片并输出简单统计,如拍摄时间分布。
所有动作都在后台运行 ,屏幕只弹出一句动画提示,比如“Ordering your food… 🍕”。
3. 运行原理:一句话到后台执行的全过程
为了让你放心,把技术流程拆开讲:
输入层
语音或文字先进入 Aiboo 的输入模块,默认用系统语音识别,也可以键盘打字。
理解层
Google Gemini 把自然语言拆成两部分:
参数(Slots):披萨、200 元以内、Jayanagar → Indiranagar……
执行层
Prexocore 接手:
模拟点击或调用系统 API(如 AlarmManager、MediaStore)。
如果该 App 有公开 DeepLink,直接用 Intent 调起页面。
反馈层
用 Lottie 动画给出一句 2 秒左右的反馈,然后安静退出。
整个过程不需要你再次点击“确认”,除非你调起的第三方 App 本身要求二次确认(如支付)。
4. 5 分钟装好并开始说话
4.1 准备条件
一台 Android 手机或模拟器,系统版本 Android 7.0 (API 24) 及以上 。
Android Studio (最新版即可,仅当你想自己编译源码)。
4.2 安装步骤
方式
步骤
直接装 APK
1. 打开 GitHub 发行页
2. 下载 aiboo.apk
3. 允许“安装未知来源应用”,点击安装即可。
源码自行编译
1. git clone https://github.com/binarybeam/Aiboo.git
2. Android Studio → Open → 选中工程 → Sync Gradle → Run。
4.3 第一次启动要填什么?
打开 Aiboo,弹出“请输入 Gemini API key”。
把 AI Studio 里复制的 key 粘进去。
提示:API key 只保存在本机,卸载或清除数据才会消失。
5. 用 20 个场景学会下命令
把 README 里的示例扩展成“可直接照抄”的句式,并补充你可能想知道的细节。
5.1 点餐
你这样说
背景说明
“点一份 12 英寸的玛格丽特披萨,预算 250 元以内”
支持中文或英文,金额用数字即可。
“帮我点上次那家店的黄焖鸡米饭”
如果外卖 App 支持历史订单 DeepLink,会直接跳到“再来一单”页。
5.2 打车
你这样说
背景说明
“现在从公司打车回家”
Aiboo 会读取系统“家”地址,需要你在地图 App 提前设好。
“预订明天上午 8 点去机场的经济型轿车”
部分打车 App 支持预约,Aiboo 会把时间、车型都填好。
5.3 发微博/X
你这样说
背景说明
“发推:Hello world!”
如果装了官方 Twitter App,会跳到撰写页,文字已填好;国际版系统同样适用。
“带图发博,配文字:今晚的月亮”
目前版本只把文字带过去,图片需要你手动选。
5.4 打电话、发短信
你这样说
背景说明
“打电话给妈妈”
需要通讯录里有“妈妈”这个联系人。
“发 WhatsApp 消息给张三:会议改到 3 点”
如果装了 WhatsApp,会跳到聊天窗口,文字已填好。
5.5 启动 App 或网页
你这样说
背景说明
“打开网易云音乐”
直接拉起 App;若未安装,跳到 Play 商店。
“在浏览器打开 github.com”
用默认浏览器访问。
5.6 拍照、截屏
你这样说
背景说明
“自拍一张”
调用前置摄像头,静默保存到 DCIM。
“截屏并发送到电脑”
截屏完成后可用系统分享面板手动选“发送到电脑”。
5.7 手电筒、音量、亮度、震动
你这样说
背景说明
“打开手电筒”
无需 root,直接调用系统 Torch API。
“把媒体音量调到 50%”
精确到百分比,0–100。
“亮度最低”
会暂时覆盖系统自动亮度,重启后恢复。
“震动一下”
200 ms 短震,用来测试权限是否开启。
5.8 闹钟与提醒
你这样说
背景说明
“明早 6:45 叫我起床跑步”
用 AlarmManager 设定,系统闹钟里可见。
“30 分钟后提醒我喝水”
相对时间提醒,到时弹系统通知。
5.9 文件增删改查
你这样说
背景说明
“把下载目录里的 test.zip 删掉”
直接删除,不进回收站。
“把照片重命名为 2025-08-15.jpg”
仅操作本地文件,不会同步到云端。
5.10 数据分析
你这样说
背景说明
“统计我上个月的照片数量”
读取 MediaStore,输出总数及按日分布。
“找出未命名的联系人”
查通讯录中 display name 为空的条目。
6. 隐私与权限:它到底访问了哪些数据?
权限分组
何时申请
用途
麦克风
首次使用语音输入
把你说的话转成文字。
联系人
当你说“打电话给张三”
匹配姓名与号码。
短信、通话记录
当你说“查未读短信”或“统计通话时长”
本地读取,无上传。
日历
当你说“下周哪天有空”
读取事件做冲突检测。
相机、存储
拍照、截屏或文件管理
仅保存到本机。
系统设置
调亮度、音量、手电筒
通过 Settings API 修改。
官方承诺:
7. 常见疑问(FAQ)
问题
回答
Q:没有谷歌服务能用吗?
A:Gemini 需联网访问谷歌服务器,但手机不必有 GMS;国内网络需自行解决科学上网。
Q:中文方言识别准确吗?
A:语音识别由系统提供,普通话效果最好,方言取决于你手机自带引擎。
Q:会不会把我通讯录上传?
A:不会。所有数据留在本地,源码公开,可自行审计。
Q:能否离线运行?
A:理解语言必须连 Gemini,其余动作纯离线。
Q:耗电厉害吗?
A:后台任务执行完立即退出,无明显耗电测试差异。
Q:可以自定义唤醒词吗?
A:当前版本无持续监听,需要点击或长按图标再说话。
8. 下一步还能做什么?
自己开发新技能 :项目开源,你可以 Fork 后添加“播放指定歌单”“查快递”等指令。
贡献翻译 :README 已有英语,欢迎提 PR 增加其他语言。
反馈 Bug :在 GitHub Issues 贴日志,作者一般 48 小时内回复。
小结
Aiboo 把大语言模型的“理解力”和 Android 系统 API 的“执行力”拼在一起,让你用日常口语 完成原本需要 5–7 次点击的任务。
如果你已经拥有 Gemini API key,又希望手机像钢铁侠的 J.A.R.V.I.S. 一样“一句话办事”,花 5 分钟装一下,很可能就舍不得卸载了。