小米MiMo-V2-Flash重磅发布:309B参数如何实现2.6倍推理加速与代码智能体新巅峰?

5天前 高效码农

小米MiMo-V2-Flash:309B参数的高效AI大模型深度解析 「摘要」:小米MiMo-V2-Flash是一款采用混合专家架构的大语言模型,拥有309B总参数量但仅激活15B参数,通过128-t …

揭秘718B参数盘古Ultra-MoE模型:如何在昇腾NPU上实现高效推理?

1个月前 高效码农

开源盘古 Ultra-MoE-718B-V1.1:高效混合专家模型的实践指南 本文核心问题:如何快速上手一个总参数量达718B的混合专家语言模型,并在昇腾NPU上实现高效推理? 开源盘古 Ultra- …

欧盟反击战!开源大模型TildeOpen 30B重磅发布,小语种终于不再被遗忘

3个月前 高效码农

欧洲自己的大模型来了:TildeOpen LLM 30B 开源,小语种也能畅快用 “ 适合读者:计算机、语言学、公共管理、翻译、教育等专业的专科及以上毕业生,以及任何想知道“欧洲为什么也要做大模型”的 …