机器学习优化归档

7个月前高效码农

EmbeddingGemma：重新定义设备端嵌入模型的高效与隐私 EmbeddingGemma_Banner 在人工智能快速发展的今天，如何在资源有限的设备上实现高效、低延迟的文本嵌入，同时保障用户数 …

7个月前高效码农

智能体开发的三个实践误区：回归简单的技术哲学在人工智能技术快速迭代的今天，智能体（Agent）开发已成为技术团队关注的焦点。然而，许多开发团队在构建智能体的过程中，常常被一些听起来酷炫的概念所吸引， …

8个月前高效码农

用自然语言反思，而不是暴力调参：GEPA 如何让大模型少跑 35 倍数据就学得更好如果你只想知道结论：把每一次实验轨迹变成一段“读后感”，再让模型像遗传算法一样交叉、变异，就能在 4 个任务上平均提 …

8个月前高效码农

大型推理模型的逆缩放现象：测试时计算增加为何导致性能下降？引言近年来，大型语言模型（LLM）在推理阶段通过增加计算量（即生成更长的推理链）来提升性能已成为趋势。然而，最新研究表明，某些情况下延长推 …

9个月前高效码农

MUVERA：让多向量检索像单向量检索一样快速在当今数字化信息爆炸的时代，信息检索技术已经成为我们日常生活中不可或缺的一部分。从搜索引擎到推荐系统，从自然语言处理到数据挖掘，信息检索技 …

10个月前高效码农

HighNoon LLM：像人类一样思考的人工智能新范式 HighNoon架构图在人工智能领域，Verso Industries正引领一场革命性的变革——HighNoon LLM。这款突破性的大型语 …

10个月前高效码农

Google Gemini 2.5 Pro 升级预览版深度解析：性能跃升与开发者新利器引言：人工智能模型的持续进化在人工智能技术日新月异的今天，大型语言模型的迭代速度令人瞩目。2025年6月5日， …

11个月前高效码农

在Apple Silicon上实现大语言模型高效推理：KVSplit关键技术解析引言：突破内存限制的量化新思路 KV Cache内存对比图当我们在MacBook上运行大语言模型时，常会遇到两个棘手 …

11个月前高效码农

CATransformers：实现碳感知AI的模型与硬件协同优化框架引言：AI发展背后的碳足迹挑战近年来，人工智能技术的快速发展带来了显著的计算资源消耗。研究表明，训练一个大型语言模型的碳排放量可 …

11个月前高效码农

近年来，大型语言模型（LLM）如ChatGPT的崛起让Transformer架构家喻户晓。然而，随着对话长度的增加，Transformer的“记忆负担”问题逐渐暴露——生成响应时延迟变高、计算成本飙升 …

1年前高效码农

一、MLX框架概述：重新定义Apple设备上的机器学习开发 MLX是由苹果机器学习研究团队推出的专为Apple Silicon优化的数组计算框架，旨在为开发者提供高效的机器学习开发体验。其设计理念融合 …