数学推理归档 | 高效码农

2个月前高效码农

解码大语言模型数学推理的黑盒：ThinkARM框架深度解析本文核心问题：当我们谈论AI”推理”时，我们到底在观察什么？ThinkARM框架通过认知科学理论，将语言模型解决数学 …

6个月前高效码农

对话式导读 “有没有可能用一张家用显卡，跑出 GPT-4 级别的数学题？” ——有。MBZUAI 最新开源的 K2-Think 只用 32B 参数，就在 AIME 2024/2025、HMMT25、O …

6个月前高效码农

rStar2-Agent: 探索代理推理在数学问题解决中的应用大家好，我是这篇博客的作者。今天，我想和大家聊聊 rStar2-Agent 这个项目。它是一个专注于代理强化学习（agentic rei …

7个月前高效码农

认识 Qwen3-235B-A22B-Thinking-2507：把复杂推理模型的真实能力一次讲透本文面向已经具备基础 AI 知识、希望真正弄清「大模型推理能力」如何落地的读者。我们完全基于官方发布 …

9个月前高效码农

如何利用大规模强化学习提升模型的数学和代码推理能力引言在当今人工智能领域，推理能力一直是衡量模型性能的关键指标。从 OpenAI 提出利用强化学习（RL）训练推理模型开始，这一领域就吸引了大量关注 …