摘要 本文深入解析了 inclusionAI 团队最新发布的 Ring-mini-2.0 模型——一个基于 Ling 2.0 架构深度优化的高性能混合专家模型(MoE)。该模型仅使用 16B 总参数和 …
作者 / 团队 / 机构 作者:Yixuan Zhou、Guoyang Zeng、Xin Liu、Xiang Li、Renjie Yu、Ziyang Wang、Runchuan Ye、Weiyue S …
qwen600.cu —— 从零构建的轻量级 CUDA 推理引擎 qwen600 banner 在学习和实践 CUDA 与 GPGPU 的过程中,有了这样一个想法:能不能自己从头实现一个推理引擎?于是 …
你是否遇到过这样的问题:向AI提问时,它给出的答案总是支离破碎?或者明明文档里有完整答案,AI却只找到零星片段?这背后隐藏着一个关键问题——文档分块质量。今天我们将深入探讨一项突破性技术:分层分块(H …
“ 华为昇腾团队研发的MindVL模型,在1/10训练数据下实现与Qwen2.5-VL相当的性能表现,本文深度解析其技术架构与训练策略。 一、MindVL的核心技术创新 1. 原生分辨率视觉处理 传统 …
SketchGraphs 数据集深度解析:面向 CAD 设计与机器学习的几何关系建模 核心问题:什么是 SketchGraphs,它解决了哪些研究与应用中的痛点? SketchGraphs 是一个包含 …
一、引言:AI绘画优化的新突破 近年来,扩散模型(Diffusion Models)在图像生成领域取得显著进展,但存在两大核心瓶颈:传统方法依赖多步去噪计算导致训练效率低下,以及离线调整奖励模型难以实 …
你有没有想过,在运行一个参数规模达万亿的大型语言模型时,如何快速更新模型权重,而不中断推理过程?在强化学习场景下,模型需要频繁迭代,这往往成为瓶颈。Checkpoint Engine 就是为此而生的工 …
ChatGPT用户增长曲线图 一、全球用户增长趋势 根据OpenAI最新研究数据,ChatGPT自2022年11月发布以来呈现爆发式增长: 2023年12月:月活用户突破1亿 2024年7月:日均消息 …
“ 作者:FunAudio 团队 适用人群:计算机、电子、通信、人工智能及相关专业毕业生;对“大模型+语音”落地感兴趣的产品经理与工程团队 阅读收益:30 min 搞懂一套可直接上线的大模型语音识别方 …
你是否曾经希望有一个编程伙伴,不仅能理解你的代码,还能帮你完成繁琐的任务,甚至发现那些难以捕捉的 bug?现在,OpenAI 推出的 GPT-5-Codex 让这一愿望成为现实。作为 GPT-5 的专 …
如果你是一名对AI视频生成感兴趣的开发者,或者正在寻找一款能兼顾视频生成、模型训练的工具,那么VideoX-Fun或许能满足你的需求。它是一个功能完整的视频生成pipeline,不仅能直接使用预训练模 …
什么是 Shimmy? Shimmy 是一个仅有 5.1MB 的超轻量级工具,它能够在本地计算机上提供完全兼容 OpenAI 接口的 AI 模型服务。这意味着你可以使用现有的 AI 工具和应用程序,只 …
语音大模型怎么“打分”?AU-Harness 把复杂 benchmark 装进一个开源工具箱 如果你只想知道结论 AU-Harness = 一套用 Python 写的开源脚本,能把 50+ 语音数据集 …
大语言模型为何会产生幻觉?从预训练到评估的全方位解析 本文欲回答的核心问题:大语言模型的幻觉为何难以彻底消除?其根源是预训练阶段的统计特性,还是后训练阶段的评估体系偏差?我们又能通过哪些具体改革减少幻 …
欧洲自己的大模型来了:TildeOpen LLM 30B 开源,小语种也能畅快用 “ 适合读者:计算机、语言学、公共管理、翻译、教育等专业的专科及以上毕业生,以及任何想知道“欧洲为什么也要做大模型”的 …
适合对象:专科及以上毕业生,有 ComfyUI 或 Python 基础更佳,但零基础也能照抄命令跑通。 阅读收益:30 分钟内把任意 ComfyUI 工作流变成 Cursor / Cla …
MobileLLM-R1:小而精的开源推理模型新标杆 本文欲回答的核心问题 MobileLLM-R1 是什么,它为什么能在小参数规模下实现卓越的数学与代码推理性能? 在人工智能模型普遍追求参数规模的今 …
WenetSpeech-Yue:大规模多维度标注粤语语音数据集与技术实践 概述:为什么我们需要高质量的粤语语音数据集? 粤语是全球超过 8490 万人的母语,广泛使用于粤港澳及海外华人社区。然而,长期 …