机器学习归档 | 第4页共13页

AgentEvolver：7B模型如何不花一分钱自己长本事？揭秘LLM自我进化黑科技

4个月前高效码农

AgentEvolver：让大模型自己“长本事”的低成本训练框架核心问题：有没有一种办法，让 LLM 智能体不依赖人工标注、不堆算力，就能在陌生环境里持续变强？答案：AgentEvolver 用“ …

Google Gemini 3 Pro深度解析：1M上下文+多模态代理如何颠覆AI应用？

4个月前高效码农

一口气看懂 Google Gemini 3 Pro：架构、长上下文与多模态代理能力全解析适合人群：计算机/电子/自动化等相关专业毕业生、AI 产品经理、初级算法工程师阅读收益：10 min 掌握 …

MiroThinker如何用600次工具调用重新定义AI研究？揭秘开源智能体的三大突破

4个月前高效码农

你知道吗？现在的AI助手虽然能够回答问题，但面对需要多步骤工具调用的复杂研究任务时，往往会显得力不从心。不过，这个局面正在被一个名为MiroThinker的开源项目悄然改变。今天，我们就来深入了解这个 …

Uni-MoE-2.0-Omni：全球首个全开源多模态MoE模型，听懂看懂还会画画

4个月前高效码农

Uni-MoE-2.0-Omni：用一套 MoE 模型同时听懂、看懂、说话、画画，还开源了全部代码核心问题：有没有一种“全开源、一站式”的大模型，能同时处理文本、图像、音频、视频，并且把“理解”与“ …

Karpathy：让AI像专业工程师一样自动完成机器学习研发的黑科技工具

4个月前高效码农

你是否曾想过，让人工智能像专业的机器学习工程师一样，独立完成从数据处理到模型训练、评估优化的全流程工作？现在，K-Dense-AI团队开发的“karpathy”工具正在将这个想法变为现实。这款基于前沿 …

Grok 4.1震撼发布：AI如何突破情感与创意边界？

4个月前高效码农

人工智能领域再次迎来重大突破。xAI正式发布了Grok 4.1，这一新一代模型在创意表达、情感理解和事实准确性方面达到了全新高度。无论你是技术爱好者、内容创作者，还是普通用户，这篇文章将带你全面了解G …

SofT-GRPO如何用Gumbel噪声突破大模型推理瓶颈？揭秘强化学习新范式

4个月前高效码农

SofT-GRPO：突破离散token限制的新型强化学习算法本文欲回答的核心问题 SofT-GRPO如何通过创新技术提升大语言模型的推理能力？它通过引入Gumbel噪声重参数化技巧，解决了软思维推理 …

揭秘718B参数盘古Ultra-MoE模型：如何在昇腾NPU上实现高效推理？

4个月前高效码农

开源盘古 Ultra-MoE-718B-V1.1：高效混合专家模型的实践指南本文核心问题：如何快速上手一个总参数量达718B的混合专家语言模型，并在昇腾NPU上实现高效推理？开源盘古 Ultra- …

SIMA 2震撼发布：Gemini驱动的AI游戏伙伴如何颠覆3D虚拟世界？

4个月前高效码农

SIMA 2：能在3D虚拟世界中交互、推理与进化的Gemini驱动AI代理 2025年11月13日，DeepMind发布了SIMA 2——这一新一代AI代理标志着人工智能在3D虚拟环境中的应用迈出了关 …

生成模型革命：从自回归到扩散再到任意编辑的AI进化论

4个月前高效码农

探索生成模型的强大之道：从自回归到扩散，再到更进一步你有没有想过，为什么像GPT这样的语言模型总是在一步步“预测下一个词”？这听起来简单，却支撑了从聊天机器人到代码生成的整个AI世界。但当我们面对更 …

TabPFN-2.5：表格数据基础模型的最新进展

4个月前高效码农

你好，我是这篇博客的作者，一个专注于机器学习和数据科学的从业者。今天，我想和你聊聊 TabPFN-2.5，这是一个专为表格数据设计的模型。最近，Prior Labs 发布了这个版本，它在处理更大规模数 …

Kimi K2 Thinking：深度推理与工具调用的AI智能体新突破

4个月前高效码农

# Kimi K2 Thinking：重新定义AI思考与工具调用的边界 > 当AI学会深度思考，并能在数百步内稳定调用工具，会带来怎样的变革？ ## 本文欲回答的核心问题本文旨在全面解析Kim …

苹果芯片上训练大模型有多快？揭秘MLX-GRPO如何颠覆LLM训练效率

4个月前高效码农

MLX-GRPO：在Apple Silicon上高效训练大型语言模型的框架引言：MLX-GRPO是什么？它如何优化LLM训练？ MLX-GRPO是一个专为大型语言模型（LLMs）设计的训练框架，它完 …

如何让AI真正‘读懂’你的20年技术路线图？上下文工程2.0揭秘

4个月前高效码农

上下文工程 2.0：让 AI 真正“读懂”你的 20 年技术路线图核心问题：当大模型越来越像人，为什么我们还要“喂”它上下文？一句话回答：因为机器依旧不会“脑补”，只有把人类意图压成低熵信号，它才 …

LLM、RAG与AI Agent如何协同打造智能系统？

4个月前高效码农

本文章欲回答的核心问题：LLM、RAG和AI Agent有什么区别？它们如何协同工作来构建高效、落地的AI系统？在人工智能领域，许多开发者和产品经理常常困惑于LLM、RAG和AI Agent之间的关 …

DeepAgent：统一思考、工具发现与行动执行的深度推理代理

4个月前高效码农

现代AI代理面临一个核心挑战：如何在复杂、动态的环境中自主完成需要多步骤工具调用和长期规划的任务？传统代理框架通常依赖于预定义的工作流程，限制了其在大规模工具集和长视野任务中的表现。DeepAgent …

AI智能体训练数据混乱？ADP协议一统江湖，彻底解决碎片化难题

4个月前高效码农

Agent数据协议(ADP)：统一AI智能体训练数据的革命性方案本文欲回答的核心问题如何解决AI智能体训练中数据碎片化、格式不统一的根本性问题？ADP协议如何通过标准化表示语言，将分散在不同格式中 …

30%成功率背后：VitaBench如何颠覆AI智能体评估？

4个月前高效码农

🌱 VitaBench：重新定义真实世界AI智能体的评估基准当最强大的AI模型在复杂多变的真实任务中成功率不足30%，我们该如何衡量并推进下一代智能体的发展？ 1. 引言：为何我们需要重新思考智能体 …

告别金鱼脑！OpenMemory开源引擎让AI拥有可解释的长期记忆

4个月前高效码农

“ 一句话先答：它是一套完全开源、可自托管的“AI 长期记忆引擎”，让大模型像人类一样拥有可解释、可追踪、会遗忘、会反思的持久记忆，而不仅仅是 8 K 上下文的“金鱼脑”。 ” 本文欲回答的核心问题 …

🧠 当大模型开始“脑腐”：从论文到警钟的全景解读

5个月前高效码农

立场声明：本文立足于研究报道与技术观察视角，不代表任何厂商立场。文中观点基于公开研究与实验数据，部分推论带有前瞻性推测性质，已作显式标注。一、事件起点：当“Brain Rot”从人类蔓延到AI 20 …