开源革命!Voxtral Mini 4B实时语音转录:480ms延迟,13种语言,单GPU部署

1个月前 高效码农

Voxtral Mini 4B Realtime 2602:实现低延迟多语言实时语音转录的开源模型 Voxtral Mini 4B Realtime 2602 是 Mistral AI 开发的实时语音 …

Fun-ASR语音识别:高达93%准确率,如何用这款国产大模型干掉噪音与多语种难题?

3个月前 高效码农

摘要 Fun-ASR是通义实验室推出的端到端语音识别大模型,基于数千万小时真实语音数据训练,支持31种语言识别,准确率高达93%,适用于高噪声环境。本文深入解析其核心特性、环境安装步骤、推理使用方法及 …