IBM推出Bamba模型:Transformer与SSM的完美结合,突破AI效率瓶颈

1天前 高效码农

近年来,大型语言模型(LLM)如ChatGPT的崛起让Transformer架构家喻户晓。然而,随着对话长度的增加,Transformer的“记忆负担”问题逐渐暴露——生成响应时延迟变高、计算成本飙升 …

MAGI-1模型如何突破视频生成边界?深度解析24B参数自回归架构

9天前 高效码农

MAGI-1:自回归视频生成模型的技术解析与实战指南 一、MAGI-1的核心技术架构 1.1 自回归分块处理机制 MAGI-1创新性地将视频分割为24帧的独立单元(Chunk),采用分块生成策略: 流 …

Seed-Thinking-v1.5:200B推理模型如何通过强化学习超越DeepSeek R1

19天前 高效码农

Bytedance Seed-Thinking-v1.5:突破性推理模型的技术解析与应用前景 引言:推理模型的进化里程碑 2025年4月,Bytedance正式发布Seed-Thinking-v1.5 …