大型语言模型归档

2个月前高效码农

深度解读 A.X K1：519B 混合专家模型的架构设计与 Think-Fusion 推理进化 “ 内容摘要： A.X K1 是由 SK Telecom 研发的 519B 参数级 MoE 大模型，采用 …

7个月前高效码农

认识 Qwen3-235B-A22B-Thinking-2507：把复杂推理模型的真实能力一次讲透本文面向已经具备基础 AI 知识、希望真正弄清「大模型推理能力」如何落地的读者。我们完全基于官方发布 …

7个月前高效码农

从 GPT-2 到 Kimi 2：一张图看清 2025 年主流大模型架构到底改了什么这篇文章写给已经会用 LLM、却常常被技术报告里拗口名词绕晕的你。我们只用一张图、一段代码、一句白话，把 Deep …

8个月前高效码农

《AI 模型界的 “混血儿”：DeepSeek R1T2 Chimera 的诞生与优势》在 AI 模型飞速发展的当下，如何在保持模型高性能的同时降低推理成本，成为众多研究者和企业关注的焦点。近期，德 …