AI大模型归档 | 高效码农

1个月前高效码农

星辰语义大模型 TeleChat3 全面解读：国产算力训练的 105B 与 36B Thinking 版本摘要中国电信人工智能研究院开源的 TeleChat3 系列大语言模型完全基于国产算力训练， …

2个月前高效码农

深度解读 A.X K1：519B 混合专家模型的架构设计与 Think-Fusion 推理进化 “ 内容摘要： A.X K1 是由 SK Telecom 研发的 519B 参数级 MoE 大模型，采用 …

3个月前高效码农

小米MiMo-V2-Flash：309B参数的高效AI大模型深度解析「摘要」：小米MiMo-V2-Flash是一款采用混合专家架构的大语言模型，拥有309B总参数量但仅激活15B参数，通过128-t …

4个月前高效码农

开源盘古 Ultra-MoE-718B-V1.1：高效混合专家模型的实践指南本文核心问题：如何快速上手一个总参数量达718B的混合专家语言模型，并在昇腾NPU上实现高效推理？开源盘古 Ultra- …

6个月前高效码农

欧洲自己的大模型来了：TildeOpen LLM 30B 开源，小语种也能畅快用 “ 适合读者：计算机、语言学、公共管理、翻译、教育等专业的专科及以上毕业生，以及任何想知道“欧洲为什么也要做大模型”的 …