rStar-Coder小模型逆袭:7B参数代码模型如何突破USACO银牌区?

2天前 高效码农

# 让小模型也能打比赛:rStar-Coder 如何把 7B 参数的代码模型送进 USACO 银牌区 > 一张图先告诉你效果: 过去半年,如果你关注代码大模型的进展,大概率听过 DeepSeek …

Enigmata如何突破大型语言模型逻辑推理瓶颈?36种谜题数据集+强化学习训练全解析

1个月前 高效码农

Enigmata:提升大型语言模型逻辑推理能力的全新工具 在人工智能领域,大型语言模型(LLM)的进步令人瞩目。从数学计算到编程任务,这些模型展现了惊人的能力。然而,当涉及到不需要专业知识的纯粹逻辑推 …