HuMo 全景解读:用文本+图片+声音“零演员”拍真人短片

3小时前 高效码农

核心问题:没有专业团队、没有摄影棚,只靠一段文字、一张照片和一段语音,能否在 8 分钟内生成 480P 的口型同步真人视频? 答案:HuMo 开源框架已经做到,且支持 720P、17 亿参数版本,本地 …

Ring-mini-2.0高效推理:16B MoE模型如何突破代码生成与长上下文瓶颈?

3小时前 高效码农

摘要 本文深入解析了 inclusionAI 团队最新发布的 Ring-mini-2.0 模型——一个基于 Ling 2.0 架构深度优化的高性能混合专家模型(MoE)。该模型仅使用 16B 总参数和 …

VoxCPM:无分词器的 TTS 模型,用于高级语音合成

4小时前 高效码农

作者 / 团队 / 机构 作者:Yixuan Zhou、Guoyang Zeng、Xin Liu、Xiang Li、Renjie Yu、Ziyang Wang、Runchuan Ye、Weiyue S …

CUDA推理引擎新突破:qwen600如何实现QWEN3-0.6B模型高性能推理?

5小时前 高效码农

qwen600.cu —— 从零构建的轻量级 CUDA 推理引擎 qwen600 banner 在学习和实践 CUDA 与 GPGPU 的过程中,有了这样一个想法:能不能自己从头实现一个推理引擎?于是 …

提升AI回答质量的秘密武器:分层分块技术如何革新检索增强生成系统

10小时前 高效码农

你是否遇到过这样的问题:向AI提问时,它给出的答案总是支离破碎?或者明明文档里有完整答案,AI却只找到零星片段?这背后隐藏着一个关键问题——文档分块质量。今天我们将深入探讨一项突破性技术:分层分块(H …

昇腾NPU上的多模态大模型MindVL:架构、训练与性能解析

10小时前 高效码农

“ 华为昇腾团队研发的MindVL模型,在1/10训练数据下实现与Qwen2.5-VL相当的性能表现,本文深度解析其技术架构与训练策略。 一、MindVL的核心技术创新 1. 原生分辨率视觉处理 传统 …

SketchGraphs数据集:1500万CAD草图如何革新几何AI建模?

11小时前 高效码农

SketchGraphs 数据集深度解析:面向 CAD 设计与机器学习的几何关系建模 核心问题:什么是 SketchGraphs,它解决了哪些研究与应用中的痛点? SketchGraphs 是一个包含 …

3倍真实感跃升!腾讯推出Direct-Align+SRPO扩散训练新框架

1天前 高效码农

一、引言:AI绘画优化的新突破 近年来,扩散模型(Diffusion Models)在图像生成领域取得显著进展,但存在两大核心瓶颈:传统方法依赖多步去噪计算导致训练效率低下,以及离线调整奖励模型难以实 …

Checkpoint Engine:大型语言模型推理引擎中的模型权重更新中间件

1天前 高效码农

你有没有想过,在运行一个参数规模达万亿的大型语言模型时,如何快速更新模型权重,而不中断推理过程?在强化学习场景下,模型需要频繁迭代,这往往成为瓶颈。Checkpoint Engine 就是为此而生的工 …

2025年ChatGPT使用行为深度解析:AI如何重塑全球数字生活?

1天前 高效码农

ChatGPT用户增长曲线图 一、全球用户增长趋势 根据OpenAI最新研究数据,ChatGPT自2022年11月发布以来呈现爆发式增长: 2023年12月:月活用户突破1亿 2024年7月:日均消息 …

FunAudio-ASR语音识别技术揭秘:实测准确率提升30%,如何实现工业级落地?

1天前 高效码农

“ 作者:FunAudio 团队 适用人群:计算机、电子、通信、人工智能及相关专业毕业生;对“大模型+语音”落地感兴趣的产品经理与工程团队 阅读收益:30 min 搞懂一套可直接上线的大模型语音识别方 …

GPT-5-Codex升级:你的AI编程伙伴如何颠覆开发效率?

1天前 高效码农

你是否曾经希望有一个编程伙伴,不仅能理解你的代码,还能帮你完成繁琐的任务,甚至发现那些难以捕捉的 bug?现在,OpenAI 推出的 GPT-5-Codex 让这一愿望成为现实。作为 GPT-5 的专 …

VideoX-Fun:一站式视频生成与训练工具,轻松实现AI视频创作

2天前 高效码农

如果你是一名对AI视频生成感兴趣的开发者,或者正在寻找一款能兼顾视频生成、模型训练的工具,那么VideoX-Fun或许能满足你的需求。它是一个功能完整的视频生成pipeline,不仅能直接使用预训练模 …

Shimmy发布:5MB轻量级本地AI模型服务工具,全面兼容OpenAI接口

2天前 高效码农

什么是 Shimmy? Shimmy 是一个仅有 5.1MB 的超轻量级工具,它能够在本地计算机上提供完全兼容 OpenAI 接口的 AI 模型服务。这意味着你可以使用现有的 AI 工具和应用程序,只 …

神速评测!AU-Harness一键解决语音大模型评估痛点?

3天前 高效码农

语音大模型怎么“打分”?AU-Harness 把复杂 benchmark 装进一个开源工具箱 如果你只想知道结论 AU-Harness = 一套用 Python 写的开源脚本,能把 50+ 语音数据集 …

大语言模型幻觉为何难以消除?揭秘预训练统计宿命与评估陷阱

3天前 高效码农

大语言模型为何会产生幻觉?从预训练到评估的全方位解析 本文欲回答的核心问题:大语言模型的幻觉为何难以彻底消除?其根源是预训练阶段的统计特性,还是后训练阶段的评估体系偏差?我们又能通过哪些具体改革减少幻 …

欧盟反击战!开源大模型TildeOpen 30B重磅发布,小语种终于不再被遗忘

3天前 高效码农

欧洲自己的大模型来了:TildeOpen LLM 30B 开源,小语种也能畅快用 “ 适合读者:计算机、语言学、公共管理、翻译、教育等专业的专科及以上毕业生,以及任何想知道“欧洲为什么也要做大模型”的 …

把 ComfyUI 工作流变成 AI 聊天插件:Pixelle MCP 零代码实战指南

3天前 高效码农

  适合对象:专科及以上毕业生,有 ComfyUI 或 Python 基础更佳,但零基础也能照抄命令跑通。 阅读收益:30 分钟内把任意 ComfyUI 工作流变成 Cursor / Cla …

MobileLLM-R1吊打大模型?小参数学霸AI的逆袭秘笈

3天前 高效码农

MobileLLM-R1:小而精的开源推理模型新标杆 本文欲回答的核心问题 MobileLLM-R1 是什么,它为什么能在小参数规模下实现卓越的数学与代码推理性能? 在人工智能模型普遍追求参数规模的今 …

突破8490万用户壁垒!全球最大粤语语音数据集WenetSpeech-Yue的技术革命

4天前 高效码农

WenetSpeech-Yue:大规模多维度标注粤语语音数据集与技术实践 概述:为什么我们需要高质量的粤语语音数据集? 粤语是全球超过 8490 万人的母语,广泛使用于粤港澳及海外华人社区。然而,长期 …