Universal Deep Research:重新定义自主研究代理的灵活性与控制力 本文欲回答的核心问题 “能否构建一个既支持高度自定义研究策略、又兼容任意大语言模型的研究系统,而不需重新训练或微调 …
I. 摘要与概述 LongCat-Flash-Thinking 是一个高效的开源大型推理模型,由美团 LongCat 团队开发。它总参数量达到 5600 亿,但平均激活参数仅为 270 亿,这得益于创 …
ROMA:让多智能体“套娃”式协作像搭积木一样简单 把“复杂任务拆到原子级”这件事做成框架,30 秒上手,5 分钟写出第一个专属 Agent。 本文要回答的核心问题 ROMA 到底是什么? 它如何把“ …
在人工智能迅猛发展的今天,各类大模型层出不穷,如何从众多模型中选出一款既“聪明”又高效,并且价格合理的模型,已成为许多开发者和企业关注的重点。xAI 推出的 Grok 4 Fast 作为一款强调推理能 …
Klear-46B-A2.5B:高效能混合专家模型详解 一、模型核心特性解析 1. 混合专家架构创新 Klear-46B-A2.5B采用独特的混合专家(MoE)架构,在保持460亿总参数规模的同时,通 …
ParaThinker:原生并行思考——大语言模型推理能力的新突破 本文欲回答的核心问题 大语言模型在提升推理能力时,为何会遇到性能瓶颈?如何通过新的计算范式突破这一限制?ParaThinker作为一 …
大型语言模型中的解决方案聚合:多数投票并非总是正确 大家好,如果你对大型语言模型(LLM)感兴趣,想知道如何让它们在解决复杂问题时更聪明一些,那你来对地方了。最近我一直在思考这个问题,特别是通过生成多 …
你有没有想过,如何用一段视频的动作和表情,让一张静态的角色图片“活”起来?或者,你好奇怎么在视频中替换角色,同时保持场景的灯光和色调一致?如果这些问题听起来耳熟,那你来对地方了。今天,我们来聊聊Wan …
“能不能像 GPT-3 写文章那样,随便给两句声音,模型就把剩下的活儿全包圆?” 小米最新开源的 MiMo-Audio 系列,用 1 亿小时无标注语音把这个问题推到了“基本可以”的程度。下面把论文、博 …
摘要 DeepSeek-R1 是 DeepSeek-AI 团队提出的一种基于强化学习(Reinforcement Learning, RL)的大语言模型(LLM),其核心目标是通过 RL 框架激励模型 …
目录 引言 为什么研究“漫画幽默” PixelHumor 数据集的诞生 数据来源 幽默风格分类 标注流程 数据分析 实验设计与任务设置 幽默识别 幽默分类 幽默解释 顺序识别 实验结果 识别幽默:容易 …
Set Block Decoding:让大语言模型推理速度提升3-5倍的新方法 一、背景:语言模型推理为什么需要加速? 大家在用大语言模型聊天或写代码时,有没有遇到过这样的尴尬: 输出一长段代码时卡顿 …
摘要 本文深入解析了 inclusionAI 团队最新发布的 Ring-mini-2.0 模型——一个基于 Ling 2.0 架构深度优化的高性能混合专家模型(MoE)。该模型仅使用 16B 总参数和 …
引言 在人工智能快速发展的今天,视觉与语言相结合的多模态模型正成为技术前沿的热点。无论是解析复杂图表中的数学问题,还是理解图像中的语义内容,这些模型都展现出了令人惊叹的能力。然而,训练这类模型通常需要 …
在人工智能快速发展的今天,大型语言模型(LLM)正在逐步改变我们获取和处理信息的方式。然而,面对复杂、开放且需要多步推理的深度信息搜索任务时,传统模型往往显得力不从心。针对这一挑战,Tongyi La …
长久以来,我们对医疗人工智能的想象,往往停留在它能像一位博学的医生那样,通过考试或回答复杂的医学问题。大型语言模型(LLM)确实在美国医师执照考试(USMLE)等知识问答测试中取得了令人瞩目的成绩。但 …
一、为什么需要 FireRedTTS-2? 在传统的文本转语音(TTS)系统中,常见的应用场景是单人播报:例如视频配音、虚拟主播或语音助手。 然而,随着播客和对话型应用的兴起,用户对以下能力提出了更高 …
MobileLLM-R1:小而精的开源推理模型新标杆 本文欲回答的核心问题 MobileLLM-R1 是什么,它为什么能在小参数规模下实现卓越的数学与代码推理性能? 在人工智能模型普遍追求参数规模的今 …
在现代人工智能飞速发展的浪潮中,大型语言模型(LLM)正以前所未有的速度演进。通义千问团队最新推出的 Qwen3-Next-80B 系列模型,正是在这一背景下应运而生的技术成果。该系列不仅显著提升了模 …
百度ERNIE-4.5-21B-A3B-Thinking:高效MoE架构引领AI推理模型新趋势 关键词:ERNIE-4.5-21B-A3B-Thinking、百度AI、MoE模型、深度推理、长上下文、 …