大模型优化归档 | 高效码农

2个月前高效码农

Claude 开发者平台“会用工具”了：搜索、代码、示例三板斧，让 AI 像人一样“边干边学” 原文：Introducing advanced tool use on the Claude Devel …

3个月前高效码农

适合谁读：计算机、软件、人工智能相关专业的同学；对 Transformer 和大模型效率优化感兴趣的技术从业者；正在寻找训练/推理提速方案的算法工程师。阅读收益：搞懂 CALM 的核心思想、训练流程 …

3个月前高效码农

Kimi Linear：重新定义高效注意力架构的技术突破本文欲回答的核心问题在大型语言模型处理百万级上下文成为刚需的今天，如何在保持性能的同时显著提升推理效率？Kimi Linear通过创新的混合 …

3个月前高效码农

就在你读完这句话的时间里，Haiku 4.5已经处理完一段代码审查、回答了三个技术问题，还顺便优化了两个函数——而这一切的成本，只相当于几行代码的执行费用。还记得五个月前第一次使用Claude So …

4个月前高效码农

SpikingBrain技术解析：高效能、低功耗的类脑大模型一、背景与目标随着大语言模型（LLM）规模持续增长，传统Transformer架构面临两大瓶颈：训练计算量随序列长度平方级增长推理内 …

6个月前高效码农

腾讯混元 0.5B/1.8B/4B/7B 小模型全攻略：从下载到部署，一篇就够对话式长文 | 适合专科及以上读者 | 基于官方 README 2025-08-04 版先回答你最关心的 3 个问题 …

6个月前高效码农

从“会做题”到“会反思”：一文看懂 MetaStone-S1 如何让 32 B 模型追上 OpenAI o3-mini 开场白：为什么大模型也需要“考试时的草稿纸”？想象一下，你在考场上遇到一道数学 …

6个月前高效码农

Step3 是怎么把 3210 亿参数的大模型跑得比 370 亿的还便宜？通俗版技术博客：读完你就知道 Step3 为什么「大却省钱」，以及它的代码和模型该怎么用。 1. 先讲结论：为什么值得花时间 …

6个月前高效码农

用“句号”提速大模型：SepLLM 如何把一整段话压进一个标点里当你对着手机说“帮我写一封邮件”时，大模型其实在做一道“阅读海量文字 → 找到关键信息 → 生成回复”的高数题。题目越大，算力消耗越像 …

6个月前高效码农

Qwen3-Coder 本地运行全指南：释放480B参数代码模型的潜力 “ 无需云端依赖，手把手教你用消费级硬件运行最先进的代码生成大模型为什么开发者需要关注Qwen3-Coder？当阿里通义千问 …

6个月前高效码农

Cactus Compute：本地化部署 LLM/VLM/TTS 的跨平台解决方案在移动端与桌面端上，如何充分利用大模型的强大能力，同时兼顾离线运行与性能需求？Cactus Compute 为开发者 …

8个月前高效码农

ARM模型：突破大模型推理效率瓶颈的自适应推理架构引言：大模型推理面临的核心挑战近年来，大型语言模型在复杂推理任务中展现出惊人能力，但普遍存在”过度思考”现象。这种现象表现 …