语音AI 归档 | 高效码农

2个月前高效码农

NVIDIA Nemotron 流式语音识别：从模型原理到实战部署，如何用0.6B参数重塑实时ASR体验想象一下，在一个跨国视频会议中，你的语音助手不仅能实时将每个人的发言转写成文字，还能智能地加上 …

3个月前高效码农

Fun-Audio-Chat：用双分辨率与 Core-Cocktail 训练实现低延迟高保真语音对话核心问题：如何在消费级 GPU 上运行一个既能听懂人话、又能自然回复、还不会忘记原有文本能力的全双 …

5个月前高效码农

“ 当语音大模型遇上高效音频表示，会碰撞出怎样的火花？作为一名长期深耕在AI语音领域的技术人，我见证了从传统编解码器到神经编解码器的演变历程。今天，当我第一次体验LongCat-Audio-Code …