VoxCPM:无分词器的 TTS 模型,用于高级语音合成

8小时前 高效码农

作者 / 团队 / 机构 作者:Yixuan Zhou、Guoyang Zeng、Xin Liu、Xiang Li、Renjie Yu、Ziyang Wang、Runchuan Ye、Weiyue S …

AIPex:用自然语言掌控浏览器的终极自动化工具

13小时前 高效码农

重新定义浏览器自动化:AIPex 如何用自然语言解放你的双手 浏览器自动化不再是开发者的专属领域。AIPex 作为一款革命性的 Chrome 扩展,通过自然语言命令和人工智能技术,让任何人都能像与助手 …

Tongyi DeepResearch重磅发布:300亿参数智能代理模型如何颠覆深度信息搜索?

16小时前 高效码农

在人工智能快速发展的今天,大型语言模型(LLM)正在逐步改变我们获取和处理信息的方式。然而,面对复杂、开放且需要多步推理的深度信息搜索任务时,传统模型往往显得力不从心。针对这一挑战,Tongyi La …

REFRAG技术突破:AI生成内容提速30倍,长上下文处理效率飙升

1天前 高效码农

★REFRAG:让AI生成内容更快更高效的新方法★ 你是否遇到过这样的情况:向AI提问时,如果问题需要结合大量背景知识,回答速度就会变慢,甚至卡顿?就像在图书馆里找资料,如果管理员每次都要翻遍所有书架 …

FunAudio-ASR语音识别技术揭秘:实测准确率提升30%,如何实现工业级落地?

1天前 高效码农

“ 作者:FunAudio 团队 适用人群:计算机、电子、通信、人工智能及相关专业毕业生;对“大模型+语音”落地感兴趣的产品经理与工程团队 阅读收益:30 min 搞懂一套可直接上线的大模型语音识别方 …

32B参数超越120B!K2-Think模型数学推理性能全解析

5天前 高效码农

对话式导读 “有没有可能用一张家用显卡,跑出 GPT-4 级别的数学题?” ——有。MBZUAI 最新开源的 K2-Think 只用 32B 参数,就在 AIME 2024/2025、HMMT25、O …

mmBERT重磅升级:1800种语言+8倍速度,如何全面超越XLM-R?

6天前 高效码农

六年终结者:mmBERT 如何把 1800 种语言塞进一个 2-4 倍快的编码器 “ 核心问题:为什么做了 6 年“基准”的 XLM-R 今天可以被一个同样体量的编码器 mmBERT 全面取代? 答案 …

百度ERNIE-4.5-21B-A3B-Thinking重磅发布:3B激活参数如何挑战万亿模型?

6天前 高效码农

百度ERNIE-4.5-21B-A3B-Thinking:高效MoE架构引领AI推理模型新趋势 关键词:ERNIE-4.5-21B-A3B-Thinking、百度AI、MoE模型、深度推理、长上下文、 …

IndexTTS2震撼发布:全球首款零样本自回归TTS引擎实现精准卡点与情绪复刻

8天前 高效码农

IndexTTS2:第一款能“卡点”又“带情绪”的零样本语音合成引擎 本文核心问题:IndexTTS2 到底解决了什么痛点?——它让自回归 TTS 第一次既能精确控制时长,又能零样本复刻情绪,且一句话 …

通义千问ASR模型终极对比:Qwen3-ASR与Qwen-Audio-ASR选择指南(附实战代码)

8天前 高效码农

通义千问ASR模型全解析:Qwen3-ASR与Qwen-Audio-ASR的选择、使用与实践 本文欲回答的核心问题 通义千问提供的Qwen3-ASR和Qwen-Audio-ASR两种语音识别模型,在功 …

AudioStory革命性突破:大语言模型如何生成49秒连贯叙事音频?

10天前 高效码农

AudioStory: 使用大语言模型生成长形式叙事音频 你是否曾经想过,如何让一个简单的文本描述变成一段连贯的、长达几十秒的音频故事?比如,一段描述火灾卡车出动的声音场景,或者一段动画视频的配音。A …

几十行代码颠覆RAG开发!清华团队开源UltraRAG 2.0让复杂推理零负担

12天前 高效码农

UltraRAG 2.0:用极简代码构建高性能检索增强生成系统 几十行代码,实现类 Search-o1 的复杂推理流程,专注科研创新,告别工程负担。 你是否曾在构建检索增强生成(RAG)系统时,被复杂 …

EmbeddingGemma模型发布!设备端AI嵌入技术颠覆行业,308M参数如何实现隐私保护与高效检索?

12天前 高效码农

EmbeddingGemma:重新定义设备端嵌入模型的高效与隐私 EmbeddingGemma_Banner 在人工智能快速发展的今天,如何在资源有限的设备上实现高效、低延迟的文本嵌入,同时保障用户数 …

视觉故事写作革新创作体验:GPT-4o如何重塑AI时代叙事艺术?

13天前 高效码农

Visual Story-Writing:用视觉化叙事,重新定义写作体验 一句话回答:Visual Story-Writing 是一个通过自动可视化故事元素(角色、事件、时间线、位置),并允许用户通过 …

大模型幻觉终结者:证据式文本生成技术如何让AI回答可信度飙升?

14天前 高效码农

让大模型“有据可查”:一篇关于证据式文本生成的全景指南 ——写给对 LLM 真实性心存疑虑的你 “AI 说西班牙人口将在 2025 年达到 4,800 万,是真的吗?” 如果你也曾这样追问,本文可以给 …

RegressLM如何革新文本到文本回归?解密谷歌高效预测技术

15天前 高效码农

  探索 RegressLM:文本到文本回归的实用指南 你有没有想过,如何从杂乱无章的非结构化文本数据中预测数值结果,而不必陷入复杂的特征工程?这就是 RegressLM 的用武之地。这个库 …

大语言模型如何实现可信输出?134篇论文揭示证据关联核心技术

17天前 高效码农

基于证据的大语言模型文本生成:引用、归因与引用的系统性研究 在数字化时代,大语言模型(LLMs)的应用日益广泛,从智能客服到内容创作,它们正深刻改变着人类处理文本的方式。然而,随着其普及,模型输出的可 …

震惊!10秒声音克隆+实时流式合成,Marvis语音模型引爆AI交互革命

19天前 高效码农

Marvis:开启实时语音克隆与流式合成的新纪元 Marvis语音合成模型 引言 在人工智能蓬勃发展的今天,语音合成技术正以前所未有的速度改变着我们与机器交互的方式。无论是智能助手、内容创作还是无障碍 …

Hermes-4 模型突破:是什么?对国内大模型意味着什么?

20天前 高效码农

探索Hermes 4:一个结合推理和指令跟随的混合模型家族 你好!如果你对大型语言模型(LLM)感兴趣,尤其是那些能处理复杂推理任务的同时又保持通用能力的模型,那么Hermes 4可能会让你眼前一亮。 …

SQLBot:如何用自然语言秒变SQL查询?

21天前 高效码农

SQLBot —— 基于大模型的智能自然语言转SQL系统 项目概述 SQLBot 是由飞致云(FIT2CLOUD)推出的开源智能问数系统,结合大模型与RAG(检索增强生成)技术,实现高效的自然语言转S …