机器学习归档 | 第6页共9页

SWE-Perf重新定义AI性能评估：真实代码优化能力突破性测试

7个月前高效码农

代码性能优化新标杆：SWE-Perf如何评估AI模型在真实项目中的表现？代码编辑界面在软件开发领域，代码性能优化始终是提升系统效率的核心挑战。随着大语言模型（LLM）在代码生成领域取得突破性进展， …

Burn深度学习框架：用Rust实现跨平台高性能AI模型训练与部署

7个月前高效码农

# 从零开始认识 Burn：新一代深度学习框架的完整指南写给所有想用 Rust 做深度学习的人 ## 为什么又出现了“新框架”？过去几年，深度学习框架层出不穷：PyTorch 动态图灵活、Tens …

大型语言扩散模型：AI技术的未来已来，解锁前沿奥秘

7个月前高效码农

大型语言扩散模型：解锁AI技术的前沿奥秘 AI与扩散模型在人工智能（AI）的世界里，大型语言扩散模型（Large Language Diffusion Models）正逐渐崭露头角，成为研究者和从业 …

Kimi K2震撼发布：万亿参数开源MoE如何颠覆Agentic智能边界？

8个月前高效码农

Kimi K2技术解析：开源MoE模型如何突破Agentic智能边界引言在人工智能领域，Kimi K2 的发布引发了广泛关注。作为一款拥有1.04万亿参数的开源混合专家模型（MoE），它不仅在代码 …

M2-CODER引爆AI编程革命：看图写代码准确率提升2倍，7B模型挑战百亿参数

8个月前高效码农

让 AI 真正看懂设计图：M2-CODER 如何像人类程序员一样写代码 “ “如果 AI 只能读文字，却看不懂 UML 图和流程图，它就永远只算半个程序员。” —— M2-CODER 论文作者一、为 …

TextGAN-Researcher如何用‘吵架’机制革新AI研究？揭秘内部辩论框架

8个月前高效码农

用“吵架”让 AI 更聪明：TextGAN-Researcher 如何把研究任务变成一场内部辩论赛通俗拆解一篇被 GitHub 标星的研究型 AI 框架就像两位辩手在台上你来我往，交锋越激烈，观众 …

AGI革命倒计时：解密人工通用智能如何重塑未来十年？

8个月前高效码农

人工通用智能（AGI）发展现状与未来方向：跨学科视角解析 1. 什么是AGI？它与现有AI有何不同？当人们讨论人工智能时，常会提到”强AI”或”通用人工智能&#8 …

AGENT KB突破性框架：让AI智能体像人类专家一样自主学习与进化

8个月前高效码农

AGENT KB：让AI智能体像人类一样从经验中学习与成长引言：AI智能体的进化瓶颈在人工智能快速发展的今天，语言模型驱动的智能体（AI Agent）正逐步渗透到各行各业。然而，这些智能体在复杂任 …

4000万数据+80亿参数：Skywork-Reward-V2如何颠覆AI对齐？

8个月前高效码农

奖励模型训练新突破：Skywork-Reward-V2 如何通过数据质量提升 AI 对齐能力 1. 从聊天机器人到智能助理：奖励模型为何重要？当我们在使用各种 AI 助手时，是否好奇它们如何判断哪种 …

深度推荐系统如何精准选择特征组合？TayFCS框架解析与实战效果揭秘！

8个月前高效码农

深度推荐系统中的特征组合选择：TayFCS 框架解析在信息爆炸的时代，深度推荐系统（DRS）成为了各大平台精准推送内容的核心技术。从流媒体平台推荐影视作品，到电商平台推送商品，深度推荐系统都在背后发 …

HIPHOP模型如何突破推荐系统瓶颈？三大创新揭秘个性化新纪元！

8个月前高效码农

会话推荐系统的新突破：HIPHOP模型如何提升个性化推荐体验？在信息爆炸的时代，推荐系统就像数字世界的”导航员”，帮助我们在电商平台、视频网站快速找到感兴趣的内容。但传统推荐 …

LLM推理加速新突破！进度条控制AI思考过程，响应速度提升34%

8个月前高效码农

LLM 推理加速新思路：像进度条一样控制 AI 的思考过程 1. 当 AI 陷入「过度思考」困境想象你正在辅导一个学生解数学题：题目：计算组合数 C(10,3) 基础模型回答： “首先 …

Grok 4重磅发布：推理能力突破，256k上下文窗口引领AI新纪元

8个月前高效码农

Grok 4 重磅发布：两大新模型、256k 上下文和爆表性能刚刚，Grok 团队推出了全新一代模型——Grok 4 和更强力的 Grok 4 Heavy。这次更新聚焦“推理能力”，彻底剔除了非推理 …

阿里通义实验室重磅开源WebAgent！AI智能体如何突破网页信息检索极限？

8个月前高效码农

阿里通义实验室发布WebAgent：突破网页信息检索的AI智能体技术本文完整解析阿里通义实验室最新开源的WebAgent技术体系，包含WebSailor、WebDancer和WebWalker三大核 …

LLM Speedrunner震撼登场：AI代理科学创新能力评估实现重大突破

8个月前高效码农

LLM Speedrunner：自动化评估AI代理科学创新能力的基准测试系统 Unsplash图片引言：当AI开始复现人类科学突破在生成式AI技术飞速发展的今天，如何客观衡量大语言模型（LLM）代 …

从零到精通大模型开发：19个实战项目速成手册（附完整代码）

8个月前高效码农

动手做大模型系列：从零到实战的完整指南一、为什么选择这个系列？如果你是计算机相关专业的大专生或应届毕业生，面对AI技术浪潮却不知从何入手，这个系列就是为你量身打造的实践手册。我们整理了19个核心项 …

FineWeb2多语言大模型实战：从数据处理到千语种训练全解析

8个月前高效码农

如何用 FineWeb2 打造你的多语言大模型：从零开始的超详细指南引言大模型的世界里，语言的多样性一直是开发者们追求的目标。FineWeb2 的出现，为多语言大模型的训练提供了一种全新的解决方案 …

Dhanishtha-2.0震撼发布：全球首款具备中间思考能力的AI推理引擎揭秘

8个月前高效码农

Dhanishtha-2.0：AI推理技术的突破与实践在人工智能技术快速发展的今天，我们迎来了首个具备中间思考能力的AI模型——Dhanishtha-2.0。这个由HelpingAI团队开发的突破性 …

上下文工程：超越提示工程的新范式！GPT-4.1性能提升61.4%的秘密

8个月前高效码农

上下文工程：超越提示工程的新范式 – 大语言模型优化的核心技术 “通过在上下文窗口中填充恰到好处的信息，GPT-4.1 在 AIME2024 上的 pass@1 性能从 26. …

MIT团队新突破！MEM1框架让AI思考效率提升197%，内存占用暴降70%

8个月前高效码农

MEM1：让AI在复杂任务中更高效思考的突破性方法什么是长周期AI代理？在日常使用智能助手时，你可能经历过这样的场景：先问”最新显卡参数”，接着追问”哪个型号适 …