模型优化归档 | 高效码农

6个月前高效码农

带你读懂 2025 年 9 月最新论文《Metacognitive Reuse》的核心思想与落地价值。一、先抛 3 个你可能关心的问题问题一句话答案这篇研究到底解决了什么？让大模型不再“逢题 …

7个月前高效码农

理解MVPBench：一个用于将大型语言模型与多样化人类价值观对齐的基准和微调框架嗨，大家好，如果你对大型语言模型（LLM）感兴趣，特别是如何让它们更好地适应不同文化和背景下的用户价值观，那你来对地 …

7个月前高效码农

为什么强化学习微调“忘性”更小？一篇说透 RL’s Razor 原理与实战核心问题：同样把模型微调到一个新任务，为什么强化学习（RL）比监督微调（SFT）更能保住老本？一句话答案：RL …

7个月前高效码农

对话式导读 “有没有可能用一张家用显卡，跑出 GPT-4 级别的数学题？” ——有。MBZUAI 最新开源的 K2-Think 只用 32B 参数，就在 AIME 2024/2025、HMMT25、O …

7个月前高效码农

高效语言模型新突破：Jet-Nemotron如何实现速度与精度的完美平衡在人工智能领域，语言模型（Language Models）已成为推动技术进步的核心力量。然而，随着模型规模不断扩大，其计算成本 …

8个月前高效码农

开源大模型到底怎么选？一文看懂 2025 年最新参数、性能与价格全景用日常语言把 200+ 开源模型拆成「大、中、小、微」四档，教你按场景挑模型、看钱包下单、按硬件落地。所有数据均来自 Artifi …

9个月前高效码农

深度推荐系统中的特征组合选择：TayFCS 框架解析在信息爆炸的时代，深度推荐系统（DRS）成为了各大平台精准推送内容的核心技术。从流媒体平台推荐影视作品，到电商平台推送商品，深度推荐系统都在背后发 …

1年前高效码农

引言在人工智能快速发展的今天，大型语言模型（LLMs）已经成为解决复杂问题的强大工具。然而，这些模型在生成长篇推理时往往面临内存和计算成本过高的问题。为了突破这一瓶颈，LightThinker应运而 …