开源AI模型归档 | 高效码农

2个月前高效码农

探索LTX-2：如何用开源模型生成同步音频视频摘要 LTX-2是一个基于DiT的音频视频基础模型，能在单一模型中生成同步视频和音频，支持高保真输出和多性能模式。通过PyTorch代码库，你可以本地运 …

3个月前高效码农

🚀 重新定义语音识别的界限：深度解析 GLM-ASR-Nano-2512 的实战性能与部署指南 Snippet/摘要: GLM-ASR-Nano-2512是智谱AI推出的1.5B参数量开源语音识别模型 …

9个月前高效码农

探索Qwen3：开源文本嵌入与重排模型的新突破在过去一年里，人工智能领域被大型语言模型（LLMs）的耀眼发布所主导。我们见证了专有巨头的惊人进步，也看到了强大的开源替代方案的蓬勃发展。然而，人工智能 …

11个月前高效码农

开源对话生成模型Dia深度解析：从文本到真人级语音的AI革命引言：对话生成技术的突破性进展由Nari Labs研发的Dia模型近期正式开源，这款基于16亿参数的文本转语音AI，正在重新定义人机交互 …