FunAudio-ASR语音识别技术揭秘:实测准确率提升30%,如何实现工业级落地?

27天前 高效码农

“ 作者:FunAudio 团队 适用人群:计算机、电子、通信、人工智能及相关专业毕业生;对“大模型+语音”落地感兴趣的产品经理与工程团队 阅读收益:30 min 搞懂一套可直接上线的大模型语音识别方 …

OLMoASR模型开源!语音识别技术迎来新突破?

1个月前 高效码农

完全开源语音识别新标杆:OLMoASR模型训练与应用指南 为什么需要开源的语音识别模型? 在人工智能领域,语音识别技术正深刻改变人机交互方式。然而大多数先进模型仍是闭源的”黑箱&#8221 …

ESP32后端服务开源项目全解析:打造智能硬件生态新标杆

2个月前 高效码农

小智后端服务(xiaozhi-esp32-server):开源 ESP32 智能硬件的全栈解决方案 华南理工大学刘思源教授团队研发的智能硬件后端系统,支持语音识别、声纹认证与多模态交互 项目概述 小智 …

Dolphin多语言ASR模型:支持40种东方语言与22种中文方言的语音识别解决方案

6个月前 高效码农

Dolphin:突破性多语言语音识别模型的技术解析与应用指南 Dolphin多任务数据格式示意图 核心优势与技术亮点 覆盖全球语言版图 由Dataocean AI与清华大学联合研发的Dolphin模型 …