机器学习归档 | 第5页共13页

HoneyBee数据集曝光：250万CoT样本如何重塑VLM视觉推理？

5个月前高效码农

揭秘 VLM 推理的“数据炼金术”：HoneyBee 数据集与视觉-语言推理的黄金秘籍 🚀 引言：VLM 的“软肋”与 CoT 的呼唤近来，AI 界被 GPT-4o、Gemini 2.5 这样的视觉 …

Qwen3-VL如何让AI真正看懂世界？视觉语言模型的革命性突破

5个月前高效码农

Qwen3-VL完全指南：让AI真正”看懂”世界的技术革命你递给AI一张截图，它不仅能描述内容，还能操作界面、生成代码，甚至告诉你视频第23分钟发生了什么——这不是科幻，而是 …

小模型竟成大模型严师？LightReasoner让AI推理暴涨28%

5个月前高效码农

想象一下，你正盯着一个数学难题，身边坐着一位哈佛数学教授（大模型），他聪明绝顶却总在关键步卡壳；突然，一个小学生（小模型）凑过来，轻描淡写地说：“叔叔，这里不对，得这么算。”教授眼睛一亮，茅塞顿开—— …

揭秘AI记忆引擎：谷歌ReasoningBank如何让AI学会自我进化与反思学习

5个月前高效码农

——从短期任务执行者到自我进化的智能体引言：当 AI 还不会“记仇”，它就永远学不会成长想象这样一个场景：你用一个智能 AI Agent 来自动化网页操作。它昨天刚学会登录后台、批量导出报表，今 …

🚀 Ling-1T：当AI开始“非思考”——高效推理的新时代

5个月前高效码农

“ 关键词：Ling-1T、非思考模型、Evo-CoT、高效推理、FP8 训练、MoE 架构、AI模型优化、Hugging Face、ModelScope 一、AI，不再“思考”的那一天几乎所有人都 …

700万参数小模型击败千亿AI？TRM如何用递归推理颠覆行业认知

5个月前高效码农

在AI模型规模膨胀至万亿参数的时代，一个仅相当于两张手机照片大小的模型，正在ARC-AGI挑战赛上击败包括DeepSeek-R1、Gemini 2.5 Pro在内的众多庞然大物。 “更大就一定更好吗？ …

TimesFM-ICF震撼发布：解锁时间序列预测的少样本学习革命

5个月前高效码农

解锁时间序列预测的未来：TimesFM-ICF 如何让基础模型成为“即插即用”的少样本学习者嘿，朋友们！想象一下，你是一家电商公司的数据分析师，正盯着成堆的销售数据发愁。明天的新品上架，你需要预测库 …

Holo1.5模型全面解析：计算机使用代理的未来已来

5个月前高效码农

探索 Holo1.5：构建计算机使用代理的基础模型你有没有想过，AI 如何能接管电脑屏幕上那些繁琐的任务，比如点击按钮或填写表单，只需“看”一眼屏幕内容？这就是 Holo1.5 这类模型的用武之地。 …

BentoML llm-optimizer：彻底改变大语言模型推理性能调优的开源工具

6个月前高效码农

在大语言模型（LLM）推理部署的过程中，许多开发团队面临一个共同难题：如何在不依赖繁重的手动试错的情况下，为延迟、吞吐量和成本找到最优配置？BentoML 最新发布的 llm-optimizer 正是 …

扩散语言模型强化学习新纪元：TraceRL框架如何实现数学推理突破？

6个月前高效码农

Revolutionizing Reinforcement Learning for Diffusion Language Models: Introducing TraceRL and TraDo …

Klear-46B-A2.5B混合专家模型：2.5亿激活参数如何实现算力革命？

6个月前高效码农

Klear-46B-A2.5B：高效能混合专家模型详解一、模型核心特性解析 1. 混合专家架构创新 Klear-46B-A2.5B采用独特的混合专家（MoE）架构，在保持460亿总参数规模的同时，通 …

破解LLM难题：AggLM如何用强化学习超越多数投票

6个月前高效码农

大型语言模型中的解决方案聚合：多数投票并非总是正确大家好，如果你对大型语言模型（LLM）感兴趣，想知道如何让它们在解决复杂问题时更聪明一些，那你来对地方了。最近我一直在思考这个问题，特别是通过生成多 …

Memori记忆引擎：为大型语言模型注入类人记忆的革命性技术

6个月前高效码农

Memori：为大型语言模型构建类人记忆的智能引擎前言：当AI学会记忆想象一下这样的场景：当你与AI助手讨论项目需求时，它记得你上周提到的技术栈偏好；当你咨询代码问题时，它了解你正在使用的框架版本 …

为什么强化学习微调‘忘性’更小？RL’s Razor原理与实战全解析

6个月前高效码农

为什么强化学习微调“忘性”更小？一篇说透 RL’s Razor 原理与实战核心问题：同样把模型微调到一个新任务，为什么强化学习（RL）比监督微调（SFT）更能保住老本？一句话答案：RL …

大规模多模态模型能看懂网络漫画幽默吗？PixelHumor数据集揭秘AI笑点盲区

6个月前高效码农

目录引言为什么研究“漫画幽默” PixelHumor 数据集的诞生数据来源幽默风格分类标注流程数据分析实验设计与任务设置幽默识别幽默分类幽默解释顺序识别实验结果识别幽默：容易 …

解锁多模态AI新能力：使用Unsloth进行视觉强化学习训练

6个月前高效码农

引言在人工智能快速发展的今天，视觉与语言相结合的多模态模型正成为技术前沿的热点。无论是解析复杂图表中的数学问题，还是理解图像中的语义内容，这些模型都展现出了令人惊叹的能力。然而，训练这类模型通常需要 …

SketchGraphs数据集：1500万CAD草图如何革新几何AI建模？

6个月前高效码农

SketchGraphs 数据集深度解析：面向 CAD 设计与机器学习的几何关系建模核心问题：什么是 SketchGraphs，它解决了哪些研究与应用中的痛点？ SketchGraphs 是一个包含 …

Checkpoint Engine：大型语言模型推理引擎中的模型权重更新中间件

6个月前高效码农

你有没有想过，在运行一个参数规模达万亿的大型语言模型时，如何快速更新模型权重，而不中断推理过程？在强化学习场景下，模型需要频繁迭代，这往往成为瓶颈。Checkpoint Engine 就是为此而生的工 …

大语言模型幻觉为何难以消除？揭秘预训练统计宿命与评估陷阱

6个月前高效码农

大语言模型为何会产生幻觉？从预训练到评估的全方位解析本文欲回答的核心问题：大语言模型的幻觉为何难以彻底消除？其根源是预训练阶段的统计特性，还是后训练阶段的评估体系偏差？我们又能通过哪些具体改革减少幻 …

突破8490万用户壁垒！全球最大粤语语音数据集WenetSpeech-Yue的技术革命

6个月前高效码农

WenetSpeech-Yue：大规模多维度标注粤语语音数据集与技术实践概述：为什么我们需要高质量的粤语语音数据集？粤语是全球超过 8490 万人的母语，广泛使用于粤港澳及海外华人社区。然而，长期 …