机器学习归档 | 第5页共13页

揭秘AI记忆引擎：谷歌ReasoningBank如何让AI学会自我进化与反思学习

3个月前高效码农

——从短期任务执行者到自我进化的智能体引言：当 AI 还不会“记仇”，它就永远学不会成长想象这样一个场景：你用一个智能 AI Agent 来自动化网页操作。它昨天刚学会登录后台、批量导出报表，今 …

🚀 Ling-1T：当AI开始“非思考”——高效推理的新时代

3个月前高效码农

“ 关键词：Ling-1T、非思考模型、Evo-CoT、高效推理、FP8 训练、MoE 架构、AI模型优化、Hugging Face、ModelScope 一、AI，不再“思考”的那一天几乎所有人都 …

700万参数小模型击败千亿AI？TRM如何用递归推理颠覆行业认知

3个月前高效码农

在AI模型规模膨胀至万亿参数的时代，一个仅相当于两张手机照片大小的模型，正在ARC-AGI挑战赛上击败包括DeepSeek-R1、Gemini 2.5 Pro在内的众多庞然大物。 “更大就一定更好吗？ …

TimesFM-ICF震撼发布：解锁时间序列预测的少样本学习革命

4个月前高效码农

解锁时间序列预测的未来：TimesFM-ICF 如何让基础模型成为“即插即用”的少样本学习者嘿，朋友们！想象一下，你是一家电商公司的数据分析师，正盯着成堆的销售数据发愁。明天的新品上架，你需要预测库 …

Holo1.5模型全面解析：计算机使用代理的未来已来

4个月前高效码农

探索 Holo1.5：构建计算机使用代理的基础模型你有没有想过，AI 如何能接管电脑屏幕上那些繁琐的任务，比如点击按钮或填写表单，只需“看”一眼屏幕内容？这就是 Holo1.5 这类模型的用武之地。 …

BentoML llm-optimizer：彻底改变大语言模型推理性能调优的开源工具

4个月前高效码农

在大语言模型（LLM）推理部署的过程中，许多开发团队面临一个共同难题：如何在不依赖繁重的手动试错的情况下，为延迟、吞吐量和成本找到最优配置？BentoML 最新发布的 llm-optimizer 正是 …

扩散语言模型强化学习新纪元：TraceRL框架如何实现数学推理突破？

4个月前高效码农

Revolutionizing Reinforcement Learning for Diffusion Language Models: Introducing TraceRL and TraDo …

Klear-46B-A2.5B混合专家模型：2.5亿激活参数如何实现算力革命？

4个月前高效码农

Klear-46B-A2.5B：高效能混合专家模型详解一、模型核心特性解析 1. 混合专家架构创新 Klear-46B-A2.5B采用独特的混合专家（MoE）架构，在保持460亿总参数规模的同时，通 …

破解LLM难题：AggLM如何用强化学习超越多数投票

4个月前高效码农

大型语言模型中的解决方案聚合：多数投票并非总是正确大家好，如果你对大型语言模型（LLM）感兴趣，想知道如何让它们在解决复杂问题时更聪明一些，那你来对地方了。最近我一直在思考这个问题，特别是通过生成多 …

Memori记忆引擎：为大型语言模型注入类人记忆的革命性技术

4个月前高效码农

Memori：为大型语言模型构建类人记忆的智能引擎前言：当AI学会记忆想象一下这样的场景：当你与AI助手讨论项目需求时，它记得你上周提到的技术栈偏好；当你咨询代码问题时，它了解你正在使用的框架版本 …

为什么强化学习微调‘忘性’更小？RL’s Razor原理与实战全解析

4个月前高效码农

为什么强化学习微调“忘性”更小？一篇说透 RL’s Razor 原理与实战核心问题：同样把模型微调到一个新任务，为什么强化学习（RL）比监督微调（SFT）更能保住老本？一句话答案：RL …

大规模多模态模型能看懂网络漫画幽默吗？PixelHumor数据集揭秘AI笑点盲区

4个月前高效码农

目录引言为什么研究“漫画幽默” PixelHumor 数据集的诞生数据来源幽默风格分类标注流程数据分析实验设计与任务设置幽默识别幽默分类幽默解释顺序识别实验结果识别幽默：容易 …

解锁多模态AI新能力：使用Unsloth进行视觉强化学习训练

4个月前高效码农

引言在人工智能快速发展的今天，视觉与语言相结合的多模态模型正成为技术前沿的热点。无论是解析复杂图表中的数学问题，还是理解图像中的语义内容，这些模型都展现出了令人惊叹的能力。然而，训练这类模型通常需要 …

SketchGraphs数据集：1500万CAD草图如何革新几何AI建模？

4个月前高效码农

SketchGraphs 数据集深度解析：面向 CAD 设计与机器学习的几何关系建模核心问题：什么是 SketchGraphs，它解决了哪些研究与应用中的痛点？ SketchGraphs 是一个包含 …

Checkpoint Engine：大型语言模型推理引擎中的模型权重更新中间件

4个月前高效码农

你有没有想过，在运行一个参数规模达万亿的大型语言模型时，如何快速更新模型权重，而不中断推理过程？在强化学习场景下，模型需要频繁迭代，这往往成为瓶颈。Checkpoint Engine 就是为此而生的工 …

大语言模型幻觉为何难以消除？揭秘预训练统计宿命与评估陷阱

4个月前高效码农

大语言模型为何会产生幻觉？从预训练到评估的全方位解析本文欲回答的核心问题：大语言模型的幻觉为何难以彻底消除？其根源是预训练阶段的统计特性，还是后训练阶段的评估体系偏差？我们又能通过哪些具体改革减少幻 …

突破8490万用户壁垒！全球最大粤语语音数据集WenetSpeech-Yue的技术革命

4个月前高效码农

WenetSpeech-Yue：大规模多维度标注粤语语音数据集与技术实践概述：为什么我们需要高质量的粤语语音数据集？粤语是全球超过 8490 万人的母语，广泛使用于粤港澳及海外华人社区。然而，长期 …

32B参数超越120B！K2-Think模型数学推理性能全解析

4个月前高效码农

对话式导读 “有没有可能用一张家用显卡，跑出 GPT-4 级别的数学题？” ——有。MBZUAI 最新开源的 K2-Think 只用 32B 参数，就在 AIME 2024/2025、HMMT25、O …

弱模型如何监控强AI？揭秘LLM智能体红队测试新框架

4个月前高效码农

当“弱”模型监督“强”智能体：一套可落地的 LLM 监控红队框架 ❝ 关键词：LLM 智能体监控、红队测试、弱-强监督、CUA-SHADE-Arena、混合脚手架、真阳性率 ❞ 一、为什么要操心“智能 …

大模型基准测试陷信任危机？动态评估成破局关键！

4个月前高效码农

大模型基准测试的最新进展：从静态到动态评估图片来源：项目原始文件本文要回答的核心问题在大语言模型（LLM）的快速发展背景下，为什么数据污染（data contamination）成为亟需解决的问 …