TeleChat3-36B国产大模型测评:SWE-Bench 51分,超越竞品的代码与Agent能力全解析

11天前 高效码农

星辰语义大模型 TeleChat3 全面解读:国产算力训练的 105B 与 36B Thinking 版本 摘要 中国电信人工智能研究院开源的 TeleChat3 系列大语言模型完全基于国产算力训练, …

解密A.X K1:519B参数MoE大模型如何用Think-Fusion实现直觉与深度思考?

24天前 高效码农

深度解读 A.X K1:519B 混合专家模型的架构设计与 Think-Fusion 推理进化 “ 内容摘要: A.X K1 是由 SK Telecom 研发的 519B 参数级 MoE 大模型,采用 …

小米MiMo-V2-Flash重磅发布:309B参数如何实现2.6倍推理加速与代码智能体新巅峰?

1个月前 高效码农

小米MiMo-V2-Flash:309B参数的高效AI大模型深度解析 「摘要」:小米MiMo-V2-Flash是一款采用混合专家架构的大语言模型,拥有309B总参数量但仅激活15B参数,通过128-t …

揭秘718B参数盘古Ultra-MoE模型:如何在昇腾NPU上实现高效推理?

2个月前 高效码农

开源盘古 Ultra-MoE-718B-V1.1:高效混合专家模型的实践指南 本文核心问题:如何快速上手一个总参数量达718B的混合专家语言模型,并在昇腾NPU上实现高效推理? 开源盘古 Ultra- …

欧盟反击战!开源大模型TildeOpen 30B重磅发布,小语种终于不再被遗忘

4个月前 高效码农

欧洲自己的大模型来了:TildeOpen LLM 30B 开源,小语种也能畅快用 “ 适合读者:计算机、语言学、公共管理、翻译、教育等专业的专科及以上毕业生,以及任何想知道“欧洲为什么也要做大模型”的 …