站点图标 高效码农

Whispering语音转文字工具:开源免费、隐私安全的高效办公神器

Whispering:一款真正属于你的开源语音转文字工具

你是否曾经在工作中需要快速将语音转换成文字?无论是会议记录、创意构思还是代码注释,语音转文字技术已经成为现代工作流程中不可或缺的一部分。然而,市面上大多数工具要么价格昂贵,要么存在隐私隐患,甚至有些声称”本地运行”的工具实际上仍然是黑箱操作。

今天,我想向你介绍一款真正透明、开放且高效的解决方案——Whispering。这是一款我每天都在使用的开源语音转文字应用,它改变了我对语音转文字工具的认知。

为什么我们需要 Whispering?

语音转文字技术已经发展多年,但大多数工具存在几个关键问题:

  • 🍄
    价格过高:许多工具每月收费15-30美元,而实际API成本可能只有几分钱
  • 🍄
    隐私隐患:你的语音数据可能被中间商收集、分析甚至出售
  • 🍄
    黑箱操作:即使声称”本地运行”,用户也无法验证数据流向
  • 🍄
    功能受限:付费墙后隐藏着真正有用的功能

Whispering 的开发者在 README 中坦诚地分享了他的经历:”多年来,我依赖几乎够用的转录工具,但它们都是闭源的。即使是那些声称’本地’或’设备上’的工具,仍然是让我怀疑音频真正去向的黑箱。所以我构建了 Whispering。它是开源的、以本地为先的,最重要的是,对你的数据透明。”

Whispering 是什么?

简单来说,Whispering 是一款开源、本地优先的语音转文字应用。它的核心工作流程非常直观:

  1. 按下键盘快捷键
  2. 开始说话
  3. 你的语音立即转换为文字
  4. 文字自动复制到剪贴板,可直接粘贴到任何地方

它最吸引人的特点是完全透明的数据流向:你的录音数据直接从你的设备发送到你选择的服务提供商(如 Groq、OpenAI 或本地 Speaches),没有任何中间服务器。这意味着你的语音永远不会经过开发者的服务器,他们无法访问你的内容。

为什么 Whispering 不同于其他工具?

让我们看看 Whispering 与其他转录工具的关键区别:

服务提供商 每小时成本 轻度使用(每天20分钟) 中度使用(每天1小时) 重度使用(每天3小时) 传统工具收费
distil-whisper-large-v3-en (Groq) $0.02 $0.20/月 $0.60/月 $1.80/月 $15-30/月
whisper-large-v3-turbo (Groq) $0.04 $0.40/月 $1.20/月 $3.60/月 $15-30/月
gpt-4o-mini-transcribe (OpenAI) $0.18 $1.80/月 $5.40/月 $16.20/月 $15-30/月
本地转录 $0.00 $0.00/月 $0.00/月 $0.00/月 $15-30/月

这个表格清楚地展示了为什么 Whispering 能为你节省大量费用。当你直接使用 API 服务时,你只需支付实际成本,而不是为中间商的利润买单。

更重要的是,Whispering 的开源性质意味着你可以亲自验证它的行为。正如开发者所说:”我相信基础工具不应该需要信任黑箱。公司会转型、被收购或关闭。但开源是永恒的。”

如何安装和使用 Whispering?

安装 Whispering 非常简单,只需大约两分钟。以下是详细步骤:

第一步:下载 Whispering

Whispering 支持所有主流操作系统:

macOS 安装

架构 下载 要求
Apple Silicon Whispering_7.3.0_aarch64.dmg M1/M2/M3/M4 Mac
Intel Whispering_7.3.0_x64.dmg Intel 基础的 Mac

不确定你的 Mac 型号?

  1. 点击苹果菜单 → 关于本机
  2. 查看”芯片”或”处理器”:
    • 🍄
      Apple M1/M2/M3/M4 → 使用 Apple Silicon 版本
    • 🍄
      Intel Core → 使用 Intel 版本

安装步骤:

  1. 下载适合你架构的 .dmg 文件
  2. 打开下载的文件
  3. 将 Whispering 拖到”应用程序”文件夹
  4. 从”应用程序”中打开 Whispering

常见问题:

  • 🍄
    “未验证的开发者”警告:右键点击应用 → 打开 → 打开
  • 🍄
    “应用程序已损坏”错误(Apple Silicon):在终端运行 xattr -cr /Applications/Whispering.app

Windows 安装

安装程序类型 下载 说明
MSI 安装程序 Whispering_7.3.0_x64_en-US.msi 推荐的标准 Windows 安装程序
EXE 安装程序 Whispering_7.3.0_x64-setup.exe 替代安装选项

安装步骤:

  1. 下载 .msi 安装程序(推荐)
  2. 双击运行安装程序
  3. 如果出现 Windows Defender 警告:点击”更多信息” → “仍要运行”
  4. 按照安装向导操作
  5. 完成后,Whispering 将出现在开始菜单中

Linux 安装

包格式 下载 兼容系统
AppImage Whispering_7.3.0_amd64.AppImage 所有 Linux 发行版
DEB 包 Whispering_7.3.0_amd64.deb Debian, Ubuntu, Pop!_OS
RPM 包 Whispering-7.3.0-1.x86_64.rpm Fedora, RHEL, openSUSE

快速安装命令:

AppImage (通用):

wget https://github.com/epicenter-so/epicenter/releases/download/v7.3.0/Whispering_7.3.0_amd64.AppImage
chmod +x Whispering_7.3.0_amd64.AppImage
./Whispering_7.3.0_amd64.AppImage

Debian/Ubuntu:

wget https://github.com/epicenter-so/epicenter/releases/download/v7.3.0/Whispering_7.3.0_amd64.deb
sudo dpkg -i Whispering_7.3.0_amd64.deb

Fedora/RHEL:

wget https://github.com/epicenter-so/epicenter/releases/download/v7.3.0/Whispering-7.3.0-1.x86_64.rpm
sudo rpm -i Whispering-7.3.0-1.x86_64.rpm

提示:如果下载链接失效,请访问 GitHub Releases 获取最新下载。

第二步:获取 API 密钥

Whispering 需要一个 API 密钥来连接转录服务。开发者推荐使用 Groq,原因很充分:

“为什么选择 Groq?速度最快的模型、超高的准确性、慷慨的免费额度,以及无与伦比的价格(使用 distil-whisper-large-v3-en 低至每小时 $0.02)”

获取 Groq API 密钥的步骤:

  1. 访问 console.groq.com/keys
  2. 注册账号 → 创建 API 密钥 → 复制密钥
  3. 无需信用卡即可使用免费额度,立即开始转录

第三步:连接并测试

  1. 打开 Whispering
  2. 点击设置(⚙️) → 转录
  3. 选择 Groq → 在”Groq API 密钥”处粘贴你的密钥
  4. 点击录音按钮(或按 Cmd+Shift+; 任意位置)并说”测试 Whispering”
  5. 成功!你的文字现在已复制到剪贴板,可粘贴到任何地方

高级功能:解锁 Whispering 的全部潜力

安装完成后,你可能会惊讶于 Whispering 提供的丰富功能。以下是一些值得关注的高级特性:

1. 多种转录服务选择

Whispering 支持多种转录服务,你可以根据需求选择:

  • 🍄
    Groq(推荐):速度最快、价格最便宜($0.02/小时)
  • 🍄
    OpenAI:行业标准,提供 whisper-1gpt-4o 系列模型
  • 🍄
    ElevenLabs:高质量语音 AI
  • 🍄
    Speaches(本地):完全隐私保护,离线使用,永久免费

2. AI 驱动的文本转换

Whispering 最强大的功能之一是能够自动转换你的转录文本。例如,你可以设置一个”格式化文本”转换:

  1. 点击顶部栏的”转换”(📚)
  2. 点击”创建转换” → 命名为”格式化文本”
  3. 添加一个提示转换步骤:
    • 🍄
      模型:Claude Sonnet 3.5(或你偏好的 AI)
    • 🍄
      系统提示:提供详细的格式化指南
    • 🍄
      用户提示:这里是需要格式化的文本:{{input}}

这些转换可以:

  • 🍄
    自动修复语法和标点
  • 🍄
    翻译成其他语言
  • 🍄
    将口语转换为专业写作
  • 🍄
    创建摘要或要点列表
  • 🍄
    去除填充词(”嗯”、”啊”)
  • 🍄
    多步骤串联处理

3. 语音活动检测(VAD)

如果你喜欢真正的免提操作,语音活动检测功能非常适合你:

启用方式:

  • 🍄
    选项1:在主页点击”语音激活”标签(在”手动”旁边)
  • 🍄
    选项2:通过设置 → 录音 → 在”录音模式”下拉菜单中选择”语音激活”

工作原理:

  1. 按一次快捷键 → VAD 开始监听
  2. 说话 → 自动开始录音
  3. 停止说话 → 短暂暂停后自动停止录音
  4. 转录结果立即显示

这非常适合无需按住按键的听写场景!

4. 自定义快捷键

你可以将录音快捷键更改为任何你觉得自然的组合:

  1. 进入设置 → 录音
  2. 点击快捷键字段
  3. 按下你想要的组合键
  4. 常用选择:F1Cmd+Space+RCtrl+Shift+V

隐私与数据安全:Whispering 如何处理你的信息?

对于关心隐私的用户,Whispering 的数据处理方式值得详细说明:

  • 🍄
    本地存储:录音和转录文本存储在设备的 IndexedDB 中
  • 🍄
    转录服务:仅将录音发送到你选择的外部服务(如 OpenAI、Groq)或本地 Speaches
  • 🍄
    转换服务:可选地将转录文本发送到你选择的 LLM 服务提供商

关键点:Whispering 没有中间服务器。你的音频直接从你的设备发送到你选择的服务提供商,使用你自己的 API 密钥。

开发者特别强调:”你的录音保留在设备上的 IndexedDB 中。转录时,音频直接发送到你选择的提供商。没有中间服务器。为了最大程度的隐私,请使用本地转录。”

值得一提的是,Whispering 使用 Aptabase 进行匿名事件日志记录,这是一个开源的、注重隐私的分析服务。没有个人数据附加到这些事件上,你可以在设置中随时关闭此功能。

常见问题解答

Whispering 与其他转录应用有什么不同?

大多数应用是收取 $30/月的中间商,而这些 API 调用成本只有几分钱。使用 Whispering,你使用自己的 API 密钥并直接向提供商付费。你的音频直接从你的设备发送到 API,中间没有服务器,没有数据收集,没有订阅。

开发者表示:”我为自己构建了这个,并每天使用它。代码是开源的,因此你可以验证它的确切行为。”

Whispering 是用什么构建的?

Svelte 5 + Tauri。应用体积小(约 22MB),启动迅速,资源占用极少。代码库干净且有良好文档,适合学习或贡献。

我可以离线使用吗?

可以,使用 Speaches 提供商进行本地转录。无需互联网,无需 API 密钥,完全私密。

实际成本是多少?

使用 Groq(开发者最爱):0.06/小时。使用 OpenAI:0.36/小时。本地转录:永久免费。开发者表示每天使用数小时,总费用约 $3/月。

真的私密吗?

你的录音保留在设备上的 IndexedDB 中。转录时,音频直接发送到你选择的提供商,使用你的 API 密钥。没有中间服务器。为了最大程度的隐私,请使用本地转录。

我可以自动格式化输出吗?

可以——设置 AI 转换以修复语法、翻译语言或重新格式化文本。适用于任何 LLM 提供商。

支持哪些平台?

桌面:Mac(Intel 和 Apple Silicon)、Windows、Linux。网络:任何现代浏览器,访问 whispering.epicenter.so

为什么 Whispering 值得你尝试?

Whispering 代表了开源软件的真正价值:透明、可审计、无供应商锁定。它不是为了追逐短期流量而设计的”爆款”应用,而是为了解决实际问题而构建的实用工具。

开发者分享了他的个人经历:”我真的很喜欢免提语音听写。多年来,我依赖几乎够用的转录工具,但它们都是闭源的。即使是那些声称’本地’或’设备上’的工具,仍然是黑箱,让我怀疑我的音频真正去了哪里。所以我构建了 Whispering。”

他继续解释道:”生产力应用应该是开源的,并对你的数据透明,但也需要匹配付费闭源软件的用户体验。我希望 Whispering 接近那个点。我每天使用它数小时,从编码到在办公室搬披萨盒时思考。”

这款应用已经融入了他的日常工作流程,从编程到日常思考。如果你也经常需要语音转文字功能,Whispering 值得一试。

结语:开源工具的未来

Whispering 的存在提醒我们,基础工具不应该需要信任黑箱。正如开发者所说:”公司会转型、被收购或关闭。但开源是永恒的。”

通过直接连接到 API 服务提供商,Whispering 消除了不必要的中间层,让你只为实际使用的资源付费。它证明了开源软件不仅可以与商业产品竞争,而且可以在透明度、隐私和成本效益方面超越它们。

无论你是开发者、作家、学生还是任何需要频繁进行语音转文字操作的人,Whispering 都提供了一个值得考虑的替代方案。它可能不是最花哨的工具,但它是一个你真正可以信任的工具。

如果你对开源软件和透明数据处理感兴趣,不妨下载 Whispering 亲自体验。也许,就像它的开发者一样,你会发现它已经成为你日常工具箱中不可或缺的一部分。

退出移动版