深度学习归档 | 第3页共6页

字节跳动Seed Diffusion引爆AI代码生成！速度提升5倍，质量不输AR模型？

7个月前高效码农

代码生成也能像图片扩散一样快？——字节跳动 Seed Diffusion 实测笔记更新时间：2025 年 8 月 1 日 “ 想象一下：你写一句需求，模型在 1 秒内就给出 2000 多行可用的 P …

Cogito v2震撼发布：自我进化AI突破极限，671B模型挑战闭源巨头

7个月前高效码农

认识 Cogito v2 预览版：自我进化的下一代大模型本文由 DeepCogito 团队发布，完整介绍其全新开源的 Cogito v2 系列模型。这些模型通过创新的“自我改进”机制，显著提升了核心 …

用500美元跑通视频生成革命：Pusa V1.0极简指南

7个月前高效码农

用 500 美元就能跑通的视频生成新范式：Pusa V1.0 通俗全指南读完本文，你将知道： Pusa 是什么，为什么它能用 4 000 条样例、500 美元预算，就打败需要 1 000 万条样例、 …

Qwen3-30B-A3B-Instruct-2507模型全面解析：性能提升23%的通义千问新突破

7个月前高效码农

Qwen3-30B-A3B-Instruct-2507 模型深度解析与实用指南引言：大语言模型的进化之路在人工智能技术持续演进的背景下，大语言模型（LLM）正以前所未有的速度突破技术边界。作为通义 …

突破性HRM模型：如何解决AI复杂推理难题？

7个月前高效码农

突破性AI模型HRM：如何解决复杂推理难题？一、AI推理领域的新突破：HRM模型诞生背景在人工智能领域，复杂推理任务始终是技术突破的重点方向。传统大模型依赖的链式思维（Chain-of-Thoug …

GLM-4.5震撼发布！355B参数如何颠覆AI推理与编码？

7个月前高效码农

GLM-4.5：推理、编码与智能体能力的统一突破 2025年7月28日 · 研究关键词：大语言模型、AI智能体、代码生成、推理能力、GLM-4.5 一、为什么需要“全能型”AI模型？当前AI领域面 …

Higgs Audio V2震撼发布！75.7%情感表达胜率重新定义语音合成

8个月前高效码农

Higgs Audio V2：重新定义语音生成的表达能力声音可视化艺术（图片来源：Unsplash）在人工智能语音合成领域，突破性的创新正以惊人速度涌现。今天，我们聚焦Boson AI开源的Hig …

Kimi K2震撼发布：万亿参数开源MoE如何颠覆Agentic智能边界？

8个月前高效码农

Kimi K2技术解析：开源MoE模型如何突破Agentic智能边界引言在人工智能领域，Kimi K2 的发布引发了广泛关注。作为一款拥有1.04万亿参数的开源混合专家模型（MoE），它不仅在代码 …

2025大语言模型架构大揭秘：Transformer如何突破效率极限？

8个月前高效码农

2025年主流大语言模型架构演进：效率与创新的平衡术七年来，从GPT-2到今天的千亿级模型，Transformer架构的核心设计竟依然稳固。当我们剥开数据集与训练技巧的外衣，真正推动大模型进化的底层 …

200ms神速响应！双模型架构破解语音助手卡顿困局

8个月前高效码农

破解AI语音助手的响应速度瓶颈：双模型架构实战解析为什么你的语音助手总像在“思考人生”？想象这样的场景：你对着智能音箱问“今天天气如何？”，却要等待近1秒才听到回应——这种尴尬的停顿足以破坏对话的 …

微软Azure AI Foundry深度研究工具：3步破解复杂研究自动化密码

8个月前高效码农

微软Azure AI Foundry深度研究工具：用AI自动化复杂研究任务无需手动筛选海量资料，微软最新AI工具能自动完成多步骤研究并生成结构化报告一、什么是Deep Research工具？微软 …

Dhanishtha-2.0震撼发布：全球首款具备中间思考能力的AI推理引擎揭秘

8个月前高效码农

Dhanishtha-2.0：AI推理技术的突破与实践在人工智能技术快速发展的今天，我们迎来了首个具备中间思考能力的AI模型——Dhanishtha-2.0。这个由HelpingAI团队开发的突破性 …

百度ERNIE 4.5震撼发布：424B参数刷新多模态AI新纪录

8个月前高效码农

百度ERNIE 4.5震撼发布：10款大模型开启多模态新纪元一、全景图：424B参数刷新行业纪录百度正式开源文心ERNIE 4.5系列，一次性推出10款参数规模不同的模型，覆盖从0.3B到424B …

视觉-语言-动作模型WorldVLA引爆行业：机器人操作新纪元来临！

8个月前高效码农

WorldVLA：革新机器人操作的统一视觉-语言-动作模型机器人与AI交互场景引言：机器人智能化的新突破在工业自动化和智能制造领域，机器人操作一直面临着感知-决策-执行的多维度挑战。传统机器人系 …

突破AI知识边界：MMSearch-R1如何让多模态模型学会主动搜索？

8个月前高效码农

AI如何像人类一样主动搜索？MMSearch-R1让多模态模型学会”按需查资料” 数据可视化引言：当AI遇到”知识盲区” 想象你正在使用智能助手查询某 …

震惊！视频人脸修复竟突破时间一致性难题，Dirichlet约束如何做到？

9个月前高效码农

深度解析视频人脸修复新技术：Dirichlet约束如何实现时间一致性？引言在短视频和影视后期制作中，修复模糊人脸视频是提升观看体验的关键技术。本文解析的DicFace方法突破性地解决了传统视频人脸 …

突破视觉问答的认知边界：NoteMR框架如何提升多模态大模型推理能力？

9个月前高效码农

突破视觉问答的认知边界：知识与视觉笔记如何增强多模态大模型推理能力引言：视觉问答的认知挑战在当今信息爆炸的时代，视觉问答（VQA）系统需要像人类一样理解图像内容并回答复杂问题。然而，现有的多模态大 …

闪电注意力机制如何颠覆大模型计算效率？MiniMax-M1核心技术深度解析

9个月前高效码农

MiniMax-M1：闪电注意力机制如何重塑大模型推理效率 AI芯片与光线轨迹引言：突破传统Transformer的效能瓶颈在人工智能领域，大模型推理效率已成为制约技术发展的关键瓶颈。传统Tran …

开源大模型全流程实战指南：从零环境配置到定制化微调技术解密

9个月前高效码农

开源大模型全流程指南：从环境配置到微调实战引言：拥抱开源大模型的新时代在人工智能飞速发展的今天，大型语言模型（LLM）已成为技术创新的核心驱动力。不同于闭源商业模型，开源大模型以其透明性、可定制性 …

SeedVR2揭秘：如何用一步修复技术让模糊视频重获新生？

9个月前高效码农

SeedVR2：一步修复视频的未来技术视频在我们生活中无处不在，无论是社交媒体上的短片，还是在线课程的长视频，清晰的画面总能让人赏心悦目。然而，许多视频因为分辨率低、噪点多或者模糊，影响了观看体验。 …