无需联网!本地实时语音转文字系统搭建指南(支持说话人分离)

5天前 高效码农

WhisperLiveKit:把实时语音转文字装进本地浏览器 “ “我能不能在不上传任何音频文件的情况下,把会议内容实时转成文字,并且知道是谁在说话?” WhisperLiveKit 的回答是:可以, …

MOSS-TTSD开源模型发布:双语语音合成如何颠覆AI播客制作?

24天前 高效码农

MOSS-TTSD:开源双语对话语音合成模型,让AI播客制作更简单 MOSS-TTSD模型示意图 在人工智能技术飞速发展的今天,语音合成技术已经从简单的文本转语音(TTS)进化到了更加复杂的对话式语音 …

语音语言模型(SpeechLM)如何颠覆传统语音交互?技术全景解析

1个月前 高效码农

语音语言模型(SpeechLM)技术全景:从原理到应用实践 前沿动态 🎉 重要进展:我们的综述论文《语音语言模型的最新进展》正式被自然语言处理顶会 ACL 2025 收录!本文全面解析语音语言模型(S …