用 Aiboo 让 Android 手机替你跑腿:零门槛体验 AI 语音助手
手把手教你把 Aiboo 装到手机上,并用一句话完成点餐、打车、发微博、删文件等 10 多种操作。读完你就能判断它是否值得留在主屏。
目录
-
Aiboo 是什么? -
它能帮你做什么? -
运行原理:一句话到后台执行的全过程 -
5 分钟装好并开始说话
4.1 准备条件
4.2 安装步骤
4.3 第一次启动要填什么? -
用 20 个场景学会下命令
5.1 点餐
5.2 打车
5.3 发微博/X
5.4 打电话、发短信
5.5 启动 App 或网页
5.6 拍照、截屏
5.7 手电筒、音量、亮度、震动
5.8 闹钟与提醒
5.9 文件增删改查
5.10 数据分析 -
隐私与权限:它到底访问了哪些数据? -
常见疑问(FAQ) -
下一步还能做什么?
1. Aiboo 是什么?
Aiboo 是一款 完全离线运行的 Android AI 助手。
用 Kotlin 写成,借助 Google Gemini 来理解你说的话,再通过 Prexocore 库把指令变成手机里的真实动作。
一句话总结:你说,它做,全程不打扰。
关键词 | 解释 |
---|---|
Kotlin | Android 官方主推的现代语言,性能好、语法简洁。 |
Google Gemini | 谷歌最新的大语言模型,负责把口语转成可执行指令。 |
Prexocore | 作者自研的 Android 工具包,封装权限、文件、UI 等繁琐操作。 |
2. 它能帮你做什么?
把 README 的功能表转成“人话”:
场景 | 你可以这么说 | 它实际做的事 |
---|---|---|
点外卖 | “来份 200 元以内的素披萨” | 在后台打开外卖 App,直接跳到披萨筛选页。 |
打网约车 | “从 Jayanagar 到 Indiranagar 叫辆自动车” | 打开打车软件并自动填好起终点。 |
发微博 | “发一条 Tweet:今晚月亮真圆” | 调用 Twitter/X 客户端,把文字贴进输入框等你确认发送。 |
联系朋友 | “给张三打电话” 或 “发短信给李四说晚点见” | 直接拨号或跳转到短信界面,内容已填好。 |
打开应用 | “启动哔哩哔哩” | 立即打开对应 App。 |
拍照/截屏 | “拍张照片” 或 “截屏” | 静默拍照或保存当前屏幕。 |
快捷开关 | “打开手电筒” | 闪光灯亮起。 |
闹钟提醒 | “明早 7 点叫我起床健身” | 通过 AlarmManager 设定系统闹钟。 |
文件管理 | “把 Aiboo 文件夹删掉” | 后台删除,无需你手动进文件管理器。 |
数据洞察 | “分析一下最近的照片” | 读取本地图片并输出简单统计,如拍摄时间分布。 |
所有动作都在后台运行,屏幕只弹出一句动画提示,比如“Ordering your food… 🍕”。
3. 运行原理:一句话到后台执行的全过程
为了让你放心,把技术流程拆开讲:
-
输入层
语音或文字先进入 Aiboo 的输入模块,默认用系统语音识别,也可以键盘打字。 -
理解层
Google Gemini 把自然语言拆成两部分:-
意图(Intent):点餐、打车、拍照…… -
参数(Slots):披萨、200 元以内、Jayanagar → Indiranagar……
-
-
执行层
Prexocore 接手:-
检查权限(如定位、联系人)。 -
模拟点击或调用系统 API(如 AlarmManager、MediaStore)。 -
如果该 App 有公开 DeepLink,直接用 Intent 调起页面。
-
-
反馈层
用 Lottie 动画给出一句 2 秒左右的反馈,然后安静退出。
整个过程不需要你再次点击“确认”,除非你调起的第三方 App 本身要求二次确认(如支付)。
4. 5 分钟装好并开始说话
4.1 准备条件
-
一台 Android 手机或模拟器,系统版本 Android 7.0 (API 24) 及以上。 -
Android Studio(最新版即可,仅当你想自己编译源码)。 -
Google Gemini API key:在 Google AI Studio 免费申请。
4.2 安装步骤
方式 | 步骤 |
---|---|
直接装 APK | 1. 打开 GitHub 发行页 2. 下载 aiboo.apk 3. 允许“安装未知来源应用”,点击安装即可。 |
源码自行编译 | 1. git clone https://github.com/binarybeam/Aiboo.git 2. Android Studio → Open → 选中工程 → Sync Gradle → Run。 |
4.3 第一次启动要填什么?
-
打开 Aiboo,弹出“请输入 Gemini API key”。 -
把 AI Studio 里复制的 key 粘进去。 -
可选:填入自定义模型名(留空则用默认模型)。 -
点击保存,主界面出现麦克风图标,即可说话。
提示:API key 只保存在本机,卸载或清除数据才会消失。
5. 用 20 个场景学会下命令
把 README 里的示例扩展成“可直接照抄”的句式,并补充你可能想知道的细节。
5.1 点餐
你这样说 | 背景说明 |
---|---|
“点一份 12 英寸的玛格丽特披萨,预算 250 元以内” | 支持中文或英文,金额用数字即可。 |
“帮我点上次那家店的黄焖鸡米饭” | 如果外卖 App 支持历史订单 DeepLink,会直接跳到“再来一单”页。 |
5.2 打车
你这样说 | 背景说明 |
---|---|
“现在从公司打车回家” | Aiboo 会读取系统“家”地址,需要你在地图 App 提前设好。 |
“预订明天上午 8 点去机场的经济型轿车” | 部分打车 App 支持预约,Aiboo 会把时间、车型都填好。 |
5.3 发微博/X
你这样说 | 背景说明 |
---|---|
“发推:Hello world!” | 如果装了官方 Twitter App,会跳到撰写页,文字已填好;国际版系统同样适用。 |
“带图发博,配文字:今晚的月亮” | 目前版本只把文字带过去,图片需要你手动选。 |
5.4 打电话、发短信
你这样说 | 背景说明 |
---|---|
“打电话给妈妈” | 需要通讯录里有“妈妈”这个联系人。 |
“发 WhatsApp 消息给张三:会议改到 3 点” | 如果装了 WhatsApp,会跳到聊天窗口,文字已填好。 |
5.5 启动 App 或网页
你这样说 | 背景说明 |
---|---|
“打开网易云音乐” | 直接拉起 App;若未安装,跳到 Play 商店。 |
“在浏览器打开 github.com” | 用默认浏览器访问。 |
5.6 拍照、截屏
你这样说 | 背景说明 |
---|---|
“自拍一张” | 调用前置摄像头,静默保存到 DCIM。 |
“截屏并发送到电脑” | 截屏完成后可用系统分享面板手动选“发送到电脑”。 |
5.7 手电筒、音量、亮度、震动
你这样说 | 背景说明 |
---|---|
“打开手电筒” | 无需 root,直接调用系统 Torch API。 |
“把媒体音量调到 50%” | 精确到百分比,0–100。 |
“亮度最低” | 会暂时覆盖系统自动亮度,重启后恢复。 |
“震动一下” | 200 ms 短震,用来测试权限是否开启。 |
5.8 闹钟与提醒
你这样说 | 背景说明 |
---|---|
“明早 6:45 叫我起床跑步” | 用 AlarmManager 设定,系统闹钟里可见。 |
“30 分钟后提醒我喝水” | 相对时间提醒,到时弹系统通知。 |
5.9 文件增删改查
你这样说 | 背景说明 |
---|---|
“把下载目录里的 test.zip 删掉” | 直接删除,不进回收站。 |
“把照片重命名为 2025-08-15.jpg” | 仅操作本地文件,不会同步到云端。 |
5.10 数据分析
你这样说 | 背景说明 |
---|---|
“统计我上个月的照片数量” | 读取 MediaStore,输出总数及按日分布。 |
“找出未命名的联系人” | 查通讯录中 display name 为空的条目。 |
6. 隐私与权限:它到底访问了哪些数据?
权限分组 | 何时申请 | 用途 |
---|---|---|
麦克风 | 首次使用语音输入 | 把你说的话转成文字。 |
联系人 | 当你说“打电话给张三” | 匹配姓名与号码。 |
短信、通话记录 | 当你说“查未读短信”或“统计通话时长” | 本地读取,无上传。 |
日历 | 当你说“下周哪天有空” | 读取事件做冲突检测。 |
相机、存储 | 拍照、截屏或文件管理 | 仅保存到本机。 |
系统设置 | 调亮度、音量、手电筒 | 通过 Settings API 修改。 |
官方承诺:
API key 只存本地,无云同步。 不会偷偷上传文件或聊天记录。 每一次敏感操作由你主动语音触发。
7. 常见疑问(FAQ)
问题 | 回答 |
---|---|
Q:没有谷歌服务能用吗? | A:Gemini 需联网访问谷歌服务器,但手机不必有 GMS;国内网络需自行解决科学上网。 |
Q:中文方言识别准确吗? | A:语音识别由系统提供,普通话效果最好,方言取决于你手机自带引擎。 |
Q:会不会把我通讯录上传? | A:不会。所有数据留在本地,源码公开,可自行审计。 |
Q:能否离线运行? | A:理解语言必须连 Gemini,其余动作纯离线。 |
Q:耗电厉害吗? | A:后台任务执行完立即退出,无明显耗电测试差异。 |
Q:可以自定义唤醒词吗? | A:当前版本无持续监听,需要点击或长按图标再说话。 |
8. 下一步还能做什么?
-
自己开发新技能:项目开源,你可以 Fork 后添加“播放指定歌单”“查快递”等指令。 -
贡献翻译:README 已有英语,欢迎提 PR 增加其他语言。 -
反馈 Bug:在 GitHub Issues 贴日志,作者一般 48 小时内回复。
小结
Aiboo 把大语言模型的“理解力”和 Android 系统 API 的“执行力”拼在一起,让你用日常口语完成原本需要 5–7 次点击的任务。
如果你已经拥有 Gemini API key,又希望手机像钢铁侠的 J.A.R.V.I.S. 一样“一句话办事”,花 5 分钟装一下,很可能就舍不得卸载了。