机器学习归档 | 第7页共13页

AI革命！CRINN让向量搜索提速85%的秘密

7个月前高效码农

用 AI 帮你把搜索算法变快：CRINN 实战指南 ❝ “为什么我的向量数据库越来越慢？” “有没有办法让 ANNS 算法自动优化？” “训练好的模型还能再提速吗？” ❞ 如果你也问过类似问题，这篇文 …

普通电脑也能跑千亿模型？Unsloth+gpt-oss革命性优化全指南

7个月前高效码农

全面指南：使用Unsloth运行和微调OpenAI开源模型gpt-oss 你可能会问：如何高效运行千亿参数的开源大模型？OpenAI最新开源的gpt-oss系列模型与Unsloth工具链结合，让普通开 …

MLE-STAR：63.6% Kaggle奖牌率的机器学习自动化神器

7个月前高效码农

MLE-STAR：通过搜索与针对性优化的机器学习工程智能代理在当今数据驱动的世界中，机器学习模型正被广泛应用于各个行业。然而，构建高性能的机器学习解决方案往往需要深厚的专业知识和大量的时间投入。对于 …

突破算力魔咒：SmallThinker如何实现大模型本地化高效部署？

7个月前高效码农

SmallThinker：大模型本地化部署的突破性解决方案一、为什么需要SmallThinker？在人工智能快速发展的今天，大语言模型（LLM）的能力日新月异，但部署难题始终存在。传统模型依赖昂贵 …

GEPA方法揭秘：用自然语言反思优化，让大模型训练提速35倍

7个月前高效码农

用自然语言反思，而不是暴力调参：GEPA 如何让大模型少跑 35 倍数据就学得更好如果你只想知道结论：把每一次实验轨迹变成一段“读后感”，再让模型像遗传算法一样交叉、变异，就能在 4 个任务上平均提 …

机器学习系统实战：300+案例揭秘从0到1落地全流程！

7个月前高效码农

300 个真实案例告诉你：机器学习系统是怎样从 0 到 1 跑起来的？ ——一份来自 Netflix、Airbnb、DoorDash 等 80 余家公司的实战笔记 “ 这篇长文把 300 多个生产级机 …

Google DeepMind Gemini模型实战指南：代码示例与AI开发全解析

7个月前高效码农

深入探索 Google DeepMind Gemini 模型：示例、代码片段与实战指南人工智能（AI）模型近年来发展迅速，其中 Google DeepMind 推出的 Gemini 系列在自然语言理 …

大语言模型从0到1完全解析：5大核心技术立即掌握

7个月前高效码农

大语言模型入门：从预训练到推理的完整技术解析大语言模型（Large Language Models, LLMs）已成为人工智能领域的核心技术之一。它们不仅能理解自然语言，还能生成高质量的文本、回答复 …

突破性数学AI模型Agentic-R1：双策略蒸馏技术揭秘，解题效率提升65%

7个月前高效码农

用两种老师教一个模型：Agentic-R1 如何让数学题既快又准？ “ 关键词：Agentic-R1、DualDistill、工具调用、长链推理、数学推理、代码执行、模型蒸馏 classroom wi …

32B小模型逆袭OpenAI！MetaStone-S1的’自我批改草稿纸’黑科技解密

7个月前高效码农

从“会做题”到“会反思”：一文看懂 MetaStone-S1 如何让 32 B 模型追上 OpenAI o3-mini 开场白：为什么大模型也需要“考试时的草稿纸”？想象一下，你在考场上遇到一道数学 …

MixGRPO突破性提速71%！AI绘图模型训练效率飙升

7个月前高效码农

MixGRPO：用“混合采样+滑动窗口”让 AI 绘图模型训练快 71% 一句话总结在 FLUX.1-dev 之上，MixGRPO 用“ODE+SDE 混合采样”只优化最关键的 4 步，训练时间比 …

3210亿参数大模型竟比370亿还便宜？Step3开源技术全解析

7个月前高效码农

Step3 是怎么把 3210 亿参数的大模型跑得比 370 亿的还便宜？通俗版技术博客：读完你就知道 Step3 为什么「大却省钱」，以及它的代码和模型该怎么用。 1. 先讲结论：为什么值得花时间 …

腾讯新突破！RLVMR框架如何让AI代理效率飙升80%？

7个月前高效码农

RLVMR框架：提升长程代理效率的新方法在人工智能领域，构建能够自主完成复杂长程任务（如家庭环境操作、科学实验）的智能体一直是核心挑战。本文将深入解析腾讯团队提出的RLVMR框架，通过案例和实验数据 …

RLVMR框架突破强化学习瓶颈：腾讯创新提升长程代理效率83.6%

7个月前高效码农

RLVMR框架：提升长程代理效率的新方法在人工智能领域，构建能够自主完成复杂长程任务（如家庭环境操作、科学实验）的智能体一直是核心挑战。本文将深入解析腾讯团队提出的RLVMR框架，通过案例和实验数据 …

GLM 4.5开源黑马逆袭：推理编码智能体全面碾压Qwen与Kimi的底层逻辑

7个月前高效码农

GLM 4.5：这匹开源黑马，为何在推理、编码与智能体任务中悄然超越Qwen与Kimi？ “ 真正的AI竞赛不在新闻头条里，而在GitHub的每一次提交、Hugging Face的排行榜单，以及Dis …

NEO智能体系统引爆AI革命：24小时完成数月ML工程的秘密

7个月前高效码农

NEO：重新定义机器学习工程效率的革命性智能体系统在机器学习（ML）工程领域，时间与人才始终是稀缺资源。全球仅有约30万名专业ML工程师，而市场需求却是这个数字的10倍。更令人焦虑的是，构建一个生产 …

AI自主架构设计突破！上海交大团队实现神经架构发现的‘AlphaGo时刻’

7个月前高效码农

AI自主架构设计：AlphaGo时刻在神经架构发现中的应用神经网络架构示意图一、突破性进展：AI开启架构设计新纪元 2025年，来自上海交通大学和MiniMax AI的研究团队在神经架构发现领域实 …

VLM2Vec-V2革新多模态AI：如何实现视频、图片、PDF统一向量处理？

7个月前高效码农

一篇文章看懂 VLM2Vec-V2：如何让 AI“看懂”视频、图片和 PDF 并把它变成好用的向量适用人群：AI 产品经理、工程师、科研入门者阅读收获：20 分钟掌握 VLM2Vec-V2 的核心 …

大型语言扩散模型：AI技术的未来已来，解锁前沿奥秘

7个月前高效码农

大型语言扩散模型：解锁AI技术的前沿奥秘 AI与扩散模型在人工智能（AI）的世界里，大型语言扩散模型（Large Language Diffusion Models）正逐渐崭露头角，成为研究者和从业 …

用句号提速大模型？华为新算法SepLLM让AI推理快50%！

8个月前高效码农

用“句号”提速大模型：SepLLM 如何把一整段话压进一个标点里当你对着手机说“帮我写一封邮件”时，大模型其实在做一道“阅读海量文字 → 找到关键信息 → 生成回复”的高数题。题目越大，算力消耗越像 …