用 Aiboo 让 Android 手机替你跑腿:零门槛体验 AI 语音助手

手把手教你把 Aiboo 装到手机上,并用一句话完成点餐、打车、发微博、删文件等 10 多种操作。读完你就能判断它是否值得留在主屏。


目录

  1. Aiboo 是什么?
  2. 它能帮你做什么?
  3. 运行原理:一句话到后台执行的全过程
  4. 5 分钟装好并开始说话
    4.1 准备条件
    4.2 安装步骤
    4.3 第一次启动要填什么?
  5. 用 20 个场景学会下命令
    5.1 点餐
    5.2 打车
    5.3 发微博/X
    5.4 打电话、发短信
    5.5 启动 App 或网页
    5.6 拍照、截屏
    5.7 手电筒、音量、亮度、震动
    5.8 闹钟与提醒
    5.9 文件增删改查
    5.10 数据分析
  6. 隐私与权限:它到底访问了哪些数据?
  7. 常见疑问(FAQ)
  8. 下一步还能做什么?

1. Aiboo 是什么?

Aiboo 是一款 完全离线运行的 Android AI 助手
用 Kotlin 写成,借助 Google Gemini 来理解你说的话,再通过 Prexocore 库把指令变成手机里的真实动作。
一句话总结:你说,它做,全程不打扰

关键词 解释
Kotlin Android 官方主推的现代语言,性能好、语法简洁。
Google Gemini 谷歌最新的大语言模型,负责把口语转成可执行指令。
Prexocore 作者自研的 Android 工具包,封装权限、文件、UI 等繁琐操作。

2. 它能帮你做什么?

把 README 的功能表转成“人话”:

场景 你可以这么说 它实际做的事
点外卖 “来份 200 元以内的素披萨” 在后台打开外卖 App,直接跳到披萨筛选页。
打网约车 “从 Jayanagar 到 Indiranagar 叫辆自动车” 打开打车软件并自动填好起终点。
发微博 “发一条 Tweet:今晚月亮真圆” 调用 Twitter/X 客户端,把文字贴进输入框等你确认发送。
联系朋友 “给张三打电话” 或 “发短信给李四说晚点见” 直接拨号或跳转到短信界面,内容已填好。
打开应用 “启动哔哩哔哩” 立即打开对应 App。
拍照/截屏 “拍张照片” 或 “截屏” 静默拍照或保存当前屏幕。
快捷开关 “打开手电筒” 闪光灯亮起。
闹钟提醒 “明早 7 点叫我起床健身” 通过 AlarmManager 设定系统闹钟。
文件管理 “把 Aiboo 文件夹删掉” 后台删除,无需你手动进文件管理器。
数据洞察 “分析一下最近的照片” 读取本地图片并输出简单统计,如拍摄时间分布。

所有动作都在后台运行,屏幕只弹出一句动画提示,比如“Ordering your food… 🍕”。


3. 运行原理:一句话到后台执行的全过程

为了让你放心,把技术流程拆开讲:

  1. 输入层
    语音或文字先进入 Aiboo 的输入模块,默认用系统语音识别,也可以键盘打字。
  2. 理解层
    Google Gemini 把自然语言拆成两部分:

    • 意图(Intent):点餐、打车、拍照……
    • 参数(Slots):披萨、200 元以内、Jayanagar → Indiranagar……
  3. 执行层
    Prexocore 接手:

    • 检查权限(如定位、联系人)。
    • 模拟点击或调用系统 API(如 AlarmManager、MediaStore)。
    • 如果该 App 有公开 DeepLink,直接用 Intent 调起页面。
  4. 反馈层
    用 Lottie 动画给出一句 2 秒左右的反馈,然后安静退出。

整个过程不需要你再次点击“确认”,除非你调起的第三方 App 本身要求二次确认(如支付)。


4. 5 分钟装好并开始说话

4.1 准备条件

  • 一台 Android 手机或模拟器,系统版本 Android 7.0 (API 24) 及以上
  • Android Studio(最新版即可,仅当你想自己编译源码)。
  • Google Gemini API key:在 Google AI Studio 免费申请。

4.2 安装步骤

方式 步骤
直接装 APK 1. 打开 GitHub 发行页
2. 下载 aiboo.apk
3. 允许“安装未知来源应用”,点击安装即可。
源码自行编译 1. git clone https://github.com/binarybeam/Aiboo.git
2. Android Studio → Open → 选中工程 → Sync Gradle → Run。

4.3 第一次启动要填什么?

  1. 打开 Aiboo,弹出“请输入 Gemini API key”。
  2. 把 AI Studio 里复制的 key 粘进去。
  3. 可选:填入自定义模型名(留空则用默认模型)。
  4. 点击保存,主界面出现麦克风图标,即可说话。

提示:API key 只保存在本机,卸载或清除数据才会消失。


5. 用 20 个场景学会下命令

把 README 里的示例扩展成“可直接照抄”的句式,并补充你可能想知道的细节。

5.1 点餐

你这样说 背景说明
“点一份 12 英寸的玛格丽特披萨,预算 250 元以内” 支持中文或英文,金额用数字即可。
“帮我点上次那家店的黄焖鸡米饭” 如果外卖 App 支持历史订单 DeepLink,会直接跳到“再来一单”页。

5.2 打车

你这样说 背景说明
“现在从公司打车回家” Aiboo 会读取系统“家”地址,需要你在地图 App 提前设好。
“预订明天上午 8 点去机场的经济型轿车” 部分打车 App 支持预约,Aiboo 会把时间、车型都填好。

5.3 发微博/X

你这样说 背景说明
“发推:Hello world!” 如果装了官方 Twitter App,会跳到撰写页,文字已填好;国际版系统同样适用。
“带图发博,配文字:今晚的月亮” 目前版本只把文字带过去,图片需要你手动选。

5.4 打电话、发短信

你这样说 背景说明
“打电话给妈妈” 需要通讯录里有“妈妈”这个联系人。
“发 WhatsApp 消息给张三:会议改到 3 点” 如果装了 WhatsApp,会跳到聊天窗口,文字已填好。

5.5 启动 App 或网页

你这样说 背景说明
“打开网易云音乐” 直接拉起 App;若未安装,跳到 Play 商店。
“在浏览器打开 github.com” 用默认浏览器访问。

5.6 拍照、截屏

你这样说 背景说明
“自拍一张” 调用前置摄像头,静默保存到 DCIM。
“截屏并发送到电脑” 截屏完成后可用系统分享面板手动选“发送到电脑”。

5.7 手电筒、音量、亮度、震动

你这样说 背景说明
“打开手电筒” 无需 root,直接调用系统 Torch API。
“把媒体音量调到 50%” 精确到百分比,0–100。
“亮度最低” 会暂时覆盖系统自动亮度,重启后恢复。
“震动一下” 200 ms 短震,用来测试权限是否开启。

5.8 闹钟与提醒

你这样说 背景说明
“明早 6:45 叫我起床跑步” 用 AlarmManager 设定,系统闹钟里可见。
“30 分钟后提醒我喝水” 相对时间提醒,到时弹系统通知。

5.9 文件增删改查

你这样说 背景说明
“把下载目录里的 test.zip 删掉” 直接删除,不进回收站。
“把照片重命名为 2025-08-15.jpg” 仅操作本地文件,不会同步到云端。

5.10 数据分析

你这样说 背景说明
“统计我上个月的照片数量” 读取 MediaStore,输出总数及按日分布。
“找出未命名的联系人” 查通讯录中 display name 为空的条目。

6. 隐私与权限:它到底访问了哪些数据?

权限分组 何时申请 用途
麦克风 首次使用语音输入 把你说的话转成文字。
联系人 当你说“打电话给张三” 匹配姓名与号码。
短信、通话记录 当你说“查未读短信”或“统计通话时长” 本地读取,无上传。
日历 当你说“下周哪天有空” 读取事件做冲突检测。
相机、存储 拍照、截屏或文件管理 仅保存到本机。
系统设置 调亮度、音量、手电筒 通过 Settings API 修改。

官方承诺:

  • API key 只存本地,无云同步。
  • 不会偷偷上传文件或聊天记录
  • 每一次敏感操作由你主动语音触发。

7. 常见疑问(FAQ)

问题 回答
Q:没有谷歌服务能用吗? A:Gemini 需联网访问谷歌服务器,但手机不必有 GMS;国内网络需自行解决科学上网。
Q:中文方言识别准确吗? A:语音识别由系统提供,普通话效果最好,方言取决于你手机自带引擎。
Q:会不会把我通讯录上传? A:不会。所有数据留在本地,源码公开,可自行审计。
Q:能否离线运行? A:理解语言必须连 Gemini,其余动作纯离线。
Q:耗电厉害吗? A:后台任务执行完立即退出,无明显耗电测试差异。
Q:可以自定义唤醒词吗? A:当前版本无持续监听,需要点击或长按图标再说话。

8. 下一步还能做什么?

  • 自己开发新技能:项目开源,你可以 Fork 后添加“播放指定歌单”“查快递”等指令。
  • 贡献翻译:README 已有英语,欢迎提 PR 增加其他语言。
  • 反馈 Bug:在 GitHub Issues 贴日志,作者一般 48 小时内回复。

小结

Aiboo 把大语言模型的“理解力”和 Android 系统 API 的“执行力”拼在一起,让你用日常口语完成原本需要 5–7 次点击的任务。
如果你已经拥有 Gemini API key,又希望手机像钢铁侠的 J.A.R.V.I.S. 一样“一句话办事”,花 5 分钟装一下,很可能就舍不得卸载了。