机器学习归档 | 第3页共9页

MIT突破性框架PDDL-INSTRUCT，让AI规划能力飙升64倍！准确率高达94%

5个月前高效码农

MIT革命性方法让AI规划能力提升64倍，准确率高达94%！用逻辑思维链和外部验证，MIT研究人员教会了语言模型如何一步步严谨思考。一直以来，大语言模型（LLM）在生成多步计划方面表现糟糕——它们 …

大模型推理效率提升40%？Meta最新《Metacognitive Reuse》技术全面解读

5个月前高效码农

带你读懂 2025 年 9 月最新论文《Metacognitive Reuse》的核心思想与落地价值。一、先抛 3 个你可能关心的问题问题一句话答案这篇研究到底解决了什么？让大模型不再“逢题 …

扩散语言模型强化学习新纪元：TraceRL框架如何实现数学推理突破？

6个月前高效码农

Revolutionizing Reinforcement Learning for Diffusion Language Models: Introducing TraceRL and TraDo …

美团开源5600亿参数LongCat-Flash-Thinking模型：如何实现推理效率飞跃？

6个月前高效码农

I. 摘要与概述 LongCat-Flash-Thinking 是一个高效的开源大型推理模型，由美团 LongCat 团队开发。它总参数量达到 5600 亿，但平均激活参数仅为 270 亿，这得益于创 …

Klear-46B-A2.5B混合专家模型：2.5亿激活参数如何实现算力革命？

6个月前高效码农

Klear-46B-A2.5B：高效能混合专家模型详解一、模型核心特性解析 1. 混合专家架构创新 Klear-46B-A2.5B采用独特的混合专家（MoE）架构，在保持460亿总参数规模的同时，通 …

ParaThinker突破AI推理瓶颈：并行思考让小模型秒杀大模型

6个月前高效码农

ParaThinker：原生并行思考——大语言模型推理能力的新突破本文欲回答的核心问题大语言模型在提升推理能力时，为何会遇到性能瓶颈？如何通过新的计算范式突破这一限制？ParaThinker作为一 …

破解LLM难题：AggLM如何用强化学习超越多数投票

6个月前高效码农

大型语言模型中的解决方案聚合：多数投票并非总是正确大家好，如果你对大型语言模型（LLM）感兴趣，想知道如何让它们在解决复杂问题时更聪明一些，那你来对地方了。最近我一直在思考这个问题，特别是通过生成多 …

为什么强化学习微调‘忘性’更小？RL’s Razor原理与实战全解析

6个月前高效码农

为什么强化学习微调“忘性”更小？一篇说透 RL’s Razor 原理与实战核心问题：同样把模型微调到一个新任务，为什么强化学习（RL）比监督微调（SFT）更能保住老本？一句话答案：RL …

Hermes 4 14B震撼发布！开源大语言模型推理能力再升级，如何引领AI助手新革命？

6个月前高效码农

Hermes 4 14B：更强大、更易用的开源大语言模型在人工智能迅猛发展的今天，大语言模型（LLM）已成为推动技术进步的核心力量。无论是进行复杂的逻辑推理，还是辅助日常的创意写作，一个能力强、易操 …

Ring-mini-2.0高效推理：16B MoE模型如何突破代码生成与长上下文瓶颈？

6个月前高效码农

摘要本文深入解析了 inclusionAI 团队最新发布的 Ring-mini-2.0 模型——一个基于 Ling 2.0 架构深度优化的高性能混合专家模型（MoE）。该模型仅使用 16B 总参数和 …

Tongyi DeepResearch重磅发布：300亿参数智能代理模型如何颠覆深度信息搜索？

6个月前高效码农

在人工智能快速发展的今天，大型语言模型（LLM）正在逐步改变我们获取和处理信息的方式。然而，面对复杂、开放且需要多步推理的深度信息搜索任务时，传统模型往往显得力不从心。针对这一挑战，Tongyi La …

32B参数超越120B！K2-Think模型数学推理性能全解析

6个月前高效码农

对话式导读 “有没有可能用一张家用显卡，跑出 GPT-4 级别的数学题？” ——有。MBZUAI 最新开源的 K2-Think 只用 32B 参数，就在 AIME 2024/2025、HMMT25、O …

如何为LLM代理编写高效工具：从原型到优化

6个月前高效码农

在开发AI系统时，为LLM代理提供合适的工具可以大大提升它们处理真实任务的能力。这些工具不像传统的软件函数那样固定，而是需要适应代理的非确定性行为。今天，我们来聊聊如何设计和优化这些工具，让它们真正发 …

百度ERNIE-4.5-21B-A3B-Thinking重磅发布：3B激活参数如何挑战万亿模型？

6个月前高效码农

百度ERNIE-4.5-21B-A3B-Thinking：高效MoE架构引领AI推理模型新趋势关键词：ERNIE-4.5-21B-A3B-Thinking、百度AI、MoE模型、深度推理、长上下文、 …

大模型基准测试陷信任危机？动态评估成破局关键！

6个月前高效码农

大模型基准测试的最新进展：从静态到动态评估图片来源：项目原始文件本文要回答的核心问题在大语言模型（LLM）的快速发展背景下，为什么数据污染（data contamination）成为亟需解决的问 …

spaCy实战指南：Python自然语言处理的终极工具揭秘！

6个月前高效码农

开始使用 spaCy：Python 中高级自然语言处理的实用指南你有没有想过，计算机是如何理解和处理人类语言的？如果你在 Python 中处理文本数据，spaCy 可能就是你一直在寻找的工具。它是一 …

RegressLM如何革新文本到文本回归？解密谷歌高效预测技术

6个月前高效码农

探索 RegressLM：文本到文本回归的实用指南你有没有想过，如何从杂乱无章的非结构化文本数据中预测数值结果，而不必陷入复杂的特征工程？这就是 RegressLM 的用武之地。这个库 …

突破性AI模型rStar2-Agent如何用代理强化学习征服数学难题？

6个月前高效码农

rStar2-Agent: 探索代理推理在数学问题解决中的应用大家好，我是这篇博客的作者。今天，我想和大家聊聊 rStar2-Agent 这个项目。它是一个专注于代理强化学习（agentic rei …

OLMoASR模型开源！语音识别技术迎来新突破？

6个月前高效码农

完全开源语音识别新标杆：OLMoASR模型训练与应用指南为什么需要开源的语音识别模型？在人工智能领域，语音识别技术正深刻改变人机交互方式。然而大多数先进模型仍是闭源的”黑箱&#8221 …

Hermes-4 模型突破：是什么？对国内大模型意味着什么？

6个月前高效码农

探索Hermes 4：一个结合推理和指令跟随的混合模型家族你好！如果你对大型语言模型（LLM）感兴趣，尤其是那些能处理复杂推理任务的同时又保持通用能力的模型，那么Hermes 4可能会让你眼前一亮。 …