深度学习归档 | 第2页共4页

DeepSeek稀疏注意力技术破解128K长文本魔咒，GPU显存暴降35%

6个月前高效码农

像给高速列车加铺专用轨道：列车还是那辆列车，但再也不会在 128 K 站台上挨个查票。故事开场：当“长文本”变成“长队” 凌晨两点，小黎还在跟 GPU 对视。他只想让 671 B 参数的模型读完一 …

大模型推理效率提升40%？Meta最新《Metacognitive Reuse》技术全面解读

6个月前高效码农

带你读懂 2025 年 9 月最新论文《Metacognitive Reuse》的核心思想与落地价值。一、先抛 3 个你可能关心的问题问题一句话答案这篇研究到底解决了什么？让大模型不再“逢题 …

HunyuanImage-3.0：腾讯开源的原生多模态模型，如何重新定义图像生成？

6个月前高效码农

“ 800亿参数、64专家MoE架构、自回归框架——这不仅仅是技术参数的堆砌，更是多模态理解与生成的一次彻底融合。还记得第一次使用文生图模型时的期待与落差吗？输入“一只在田野奔跑的小狗”，得到的可能 …

LangGraph实战：6个招式将大模型Token用量从25k砍到11k

6个月前高效码农

“为什么我的上下文越长，答案反而越离谱？” 如果你也在深夜对着 128k 窗口的 GPT-4 怀疑人生，这篇文章就是写给正在抠头的你。故事从一次“奖励黑客”调研开始上周，老板甩给我一个看似人畜无害 …

SpikingBrain技术解析：突破类脑大模型能效瓶颈

6个月前高效码农

SpikingBrain技术解析：高效能、低功耗的类脑大模型一、背景与目标随着大语言模型（LLM）规模持续增长，传统Transformer架构面临两大瓶颈：训练计算量随序列长度平方级增长推理内 …

Qianfan-VL爆火！百度千亿参数多模态模型如何颠覆企业OCR与数学推理？

6个月前高效码农

嘿，大家好！我是你的技术博客博主，一直在追踪 AI 领域的热点，尤其是那些能真正落地到实际工作的多模态模型。今天，我们来聊聊 Baidu AI Cloud 在 2025 年 8 月发布的 Qianfa …

Qwen3-Omni 全面解析：阿里通义千问发布的全能多模态大模型

6个月前高效码农

引言：为什么说Qwen3-Omni是AI领域的”全能选手”？还记得那些只能处理文字的传统AI模型吗？它们就像只会一种乐器的音乐家，虽然技艺精湛，但表现力有限。而现在，阿里通义 …

美团开源5600亿参数LongCat-Flash-Thinking模型：如何实现推理效率飞跃？

6个月前高效码农

I. 摘要与概述 LongCat-Flash-Thinking 是一个高效的开源大型推理模型，由美团 LongCat 团队开发。它总参数量达到 5600 亿，但平均激活参数仅为 270 亿，这得益于创 …

为什么强化学习微调‘忘性’更小？RL’s Razor原理与实战全解析

7个月前高效码农

为什么强化学习微调“忘性”更小？一篇说透 RL’s Razor 原理与实战核心问题：同样把模型微调到一个新任务，为什么强化学习（RL）比监督微调（SFT）更能保住老本？一句话答案：RL …

Ring-mini-2.0高效推理：16B MoE模型如何突破代码生成与长上下文瓶颈？

7个月前高效码农

摘要本文深入解析了 inclusionAI 团队最新发布的 Ring-mini-2.0 模型——一个基于 Ling 2.0 架构深度优化的高性能混合专家模型（MoE）。该模型仅使用 16B 总参数和 …

CUDA推理引擎新突破：qwen600如何实现QWEN3-0.6B模型高性能推理？

7个月前高效码农

qwen600.cu —— 从零构建的轻量级 CUDA 推理引擎 qwen600 banner 在学习和实践 CUDA 与 GPGPU 的过程中，有了这样一个想法：能不能自己从头实现一个推理引擎？于是 …

昇腾NPU上的多模态大模型MindVL：架构、训练与性能解析

7个月前高效码农

“ 华为昇腾团队研发的MindVL模型，在1/10训练数据下实现与Qwen2.5-VL相当的性能表现，本文深度解析其技术架构与训练策略。一、MindVL的核心技术创新 1. 原生分辨率视觉处理传统 …

Chroma1-HD震撼发布！8.9B参数开源模型如何颠覆文本生成图像领域？

7个月前高效码农

Chroma1-HD：一款强大的开源文本到图像基础模型如果你正在寻找一款高性能、易微调且完全开源的文本到图像生成模型，那么Chroma1-HD或许会成为你的理想选择。这款模型凭借8.9B参数的强大算 …

CoMPaSS框架必杀技：99%空间关系错误率归零！看AI如何精准理解“猫在狗左边”

7个月前高效码农

CoMPaSS：提升文本到图像模型空间理解的框架嗨，如果你对文本到图像生成感兴趣，你可能已经注意到这些模型能够从简单的描述中创建出令人惊叹的、逼真的图片。但你有没有想过，为什么它们有时会搞错像“猫在 …

EmbeddingGemma模型发布！设备端AI嵌入技术颠覆行业，308M参数如何实现隐私保护与高效检索？

7个月前高效码农

EmbeddingGemma：重新定义设备端嵌入模型的高效与隐私 EmbeddingGemma_Banner 在人工智能快速发展的今天，如何在资源有限的设备上实现高效、低延迟的文本嵌入，同时保障用户数 …

FOP优化器突破性算法：超大批量训练效率提升7.5倍，ResNet与Transformer加速新选择

7个月前高效码农

FOP优化器：提升大规模神经网络训练效率的新方法一、背景与挑战在深度学习领域，随着模型规模和数据量的不断增长，训练效率成为关键挑战。现代GPU虽然具备强大的计算能力，但传统优化器在面对超大规模训练 …

WebWatcher颠覆性突破：多模态智能体引领视觉语言研究新纪元

7个月前高效码农

WebWatcher：突破视觉-语言深度研究智能体的新前沿你是否曾经希望有一个助手，不仅能看懂图片，还能像人一样进行多步骤推理、使用各种工具，甚至在互联网上主动搜集信息？这听起来像是科幻小说中的情节 …

震惊！你的旧电脑竟能跑DeepSeek-V3.1：混合推理模型本地运行终极指南

7个月前高效码农

深入解析 DeepSeek-V3.1：如何在个人设备上运行强大的混合推理模型 ❝ 还在为无法本地运行大模型而烦恼吗？DeepSeek-V3.1 的量化版本让你在消费级硬件上也能体验前沿AI技术 ❞ 近 …

EchoMimicV3突破：1.3B参数如何实现多模态人体动画统一生成？

8个月前高效码农

tags: – EchoMimicV3 – 1.3B参数 – Soup-of-Tasks – Soup-of-Modals – CDCA – PhDA – Negative DPO – PNG – L …

MiMo-VL-7B震撼开源：7B参数吊打72B，你的本地视觉AI神器来了！

8个月前高效码农

小米开源 MiMo-VL-7B 系列视觉大模型：一张图看懂它究竟强在哪 “我想让电脑像人一样看图说话，又希望它别太烧钱，最好还能装在自己服务器里。” 如果你有类似的念头，小米刚放出的 MiMo-VL- …