人工智能归档 | 第7页共24页

AI代理能力进化史：从工具使用到常识推理的跨越

4个月前高效码农

引言：当AI走出聊天框 2025年被称作”代理元年”，但当我们测试了9款顶尖AI模型在真实工作场景的表现后，发现了一个残酷真相——即使是GPT-5和Claude Sonnet …

世界模型PAN解析：MBZUAI创新GLP架构突破视频生成局限 | 深度学习与AI技术

4个月前高效码农

PAN：当视频生成模型学会「理解」世界——MBZUAI 的长时程交互式世界模型深度解析你可能已经见过那些令人惊叹的 AI 视频生成工具：输入一句「无人机飞越日落城市」，就能得到一段美轮美奂的影像。但 …

Google真的悄悄解决了AI领域两个最古老难题吗？一位历史学家的亲身测试记录

4个月前高效码农

作为一名常年与18世纪手写档案打交道的工作者，我最近经历了一件让职业本能震颤的事。事情源于Google AI Studio的一个微妙变化——用户在反复尝试后，偶尔会看到两个不同答案并排显示，并被要求选 …

【GPT-5.1核心功能解析】对话式AI革命开启，Instant/Taking全面升级指南

4个月前高效码农

GPT-5.1：更智能、更具对话感的AI升级本文欲回答的核心问题：GPT-5.1作为GPT-5系列的重要升级，带来了哪些具体改进？这些改进如何影响用户体验？又有哪些个性化功能值得关注？随着AI技术 …

ERNIE-4.5-VL-28B-A3B-Thinking：轻量级多模态AI模型的性能与应用

4个月前高效码农

ERNIE-4.5-VL-28B-A3B-Thinking：多模态AI领域的突破性进展在人工智能快速发展的今天，多模态模型已经成为连接视觉与语言理解的重要桥梁。百度最新推出的ERNIE …

Maya1: 开源语音AI的新标杆——3B参数单卡实现情感化实时语音合成

4个月前高效码农

本文欲回答的核心问题：Maya1是什么？它如何通过3B参数的紧凑架构，在单张消费级GPU上实现超越商业闭源模型的情感化语音合成能力？ Maya1的诞生标志着开源语音AI迈入了一个新阶段。这款由Maya …

Ming-UniAudio：统一语音理解、生成与编辑的革命性框架

4个月前高效码农

引言本文欲回答的核心问题：如何构建一个能够同时处理语音理解、生成和编辑任务的统一模型？Ming-UniAudio通过创新的统一连续语音分词器和端到端语音语言模型，首次实现了无需时间戳条件的自由形式语 …

Meta革命性AI引擎GEM：开启广告推荐新时代！

4个月前高效码农

Meta的生成式广告模型GEM：重新定义广告推荐AI的核心引擎在当今数字广告领域，人工智能正以前所未有的速度推动着个性化推荐的发展。作为这一变革的核心驱动力，Meta的生成式广告推荐模型（GEM）正 …

TeaRAG是什么？如何让AI思考更聪明更高效

4个月前高效码农

在当今人工智能领域，大语言模型(LLM)凭借其强大的理解和生成能力，已成为各行各业的重要工具。然而，这些模型也面临着一个普遍问题：它们经常”编造”信息，即产生所谓的&#8221 …

构建神经记忆代理：使用可微分记忆、元学习和经验回放实现动态环境中的持续适应

4个月前高效码农

想象一下，你正在训练一个AI系统，它能像人类一样记住过去的经历，同时快速适应新挑战，而不会忘记之前学到的东西。这听起来像科幻？实际上，通过神经记忆代理，我们可以实现这一点。在这个教程中，我们将一步步构 …

CALM 模型如何实现训练推理算力的大幅降低？大模型优化与训练效率提升的突破性方案是什么？

4个月前高效码农

适合谁读：计算机、软件、人工智能相关专业的同学；对 Transformer 和大模型效率优化感兴趣的技术从业者；正在寻找训练/推理提速方案的算法工程师。阅读收益：搞懂 CALM 的核心思想、训练流程 …

AI数据科学家来了！DeepAnalyze如何20分钟自动生成深度分析报告？

5个月前高效码农

DeepAnalyze：当AI化身数据科学家，从原始数据到深度报告一键生成厨房里的“数据大厨”是如何炼成的？想象这样一个场景：凌晨三点，你面对着Excel里十万行的销售数据发愁。明天 …

Emu3.5震撼开源！单模型如何实现视频到世界模拟的终极统一？

5个月前高效码农

从视频到世界模型：Emu3.5 如何让 AI 一次看懂、想清、画准？核心问题：Emu3.5 只靠“下一个 token”统一视觉与语言，它到底学会了什么？我们又能用它做什么？一张图速览 Emu3.5 …

AI智能体训练数据混乱？ADP协议一统江湖，彻底解决碎片化难题

5个月前高效码农

Agent数据协议(ADP)：统一AI智能体训练数据的革命性方案本文欲回答的核心问题如何解决AI智能体训练中数据碎片化、格式不统一的根本性问题？ADP协议如何通过标准化表示语言，将分散在不同格式中 …

K2工具调用 accuracy崩塌？18家供应商暗战揭秘，第一名竟然是它！

5个月前高效码农

引言：被忽略的AI”基本功” 当企业为Kimi K2模型的API服务讨价还价时，当开发者为50ms的延迟差异争论不休时，一场关于”工具调用准确性”的静默 …

LightMem让AI告别健忘症，2025年记忆系统迎来颠覆性突破

5个月前高效码农

一个让用户崩溃的场景想象一下：你花了20分钟跟AI助手规划东京旅行，从航班时间聊到民宿选址；两小时后你问它”京都的新干线时刻”，它却反问”你之前说要去东京还是 …

你的AI助手竟有超人记忆？Python之父的新武器让AI记住你的一举一动

5个月前高效码农

当你的AI助手忽然“长出”了超人记忆：Python之父的秘密武器想象一下：你正和你的AI助手聊天，抱怨最近读的科幻小说太烧脑。它不光听懂了，还突然冒出一句：“嘿，上周你提过《沙丘》里的香料经济让我联 …

70亿参数小模型吊打巨头？AI研究助理竟有这般操作

5个月前高效码农

我让AI当我的研究助理，结果它比我查得还准还快你有没有过这样的经历：遇到一个复杂的问题，比如“在沃尔特·斯科特的某部小说里，‘中部洛锡安之心’指的是什么？”，你会打开好几个浏览器标签，在维基百科、书 …

Glyph视觉革命：AI如何用‘眼睛’看懂百万字长文本？

5个月前高效码农

视觉革命：当LLM开始用”眼睛”处理文字本文基于2025年10月最新发布的Glyph论文进行技术解析，观点仅代表个人分析一、2025年的AI困境：长文本处理的算力黑洞当O …

Glyph突破百万令牌极限：视觉压缩如何颠覆长上下文AI？

5个月前高效码农

本文核心问题解答：大型语言模型（LLM）如何在不付出高昂计算和内存成本的情况下处理百万级令牌的上下文？在AI时代，大型语言模型驱动着从文档分析到多步推理的一切应用。然而，当上下文扩展到数十万甚至数 …