AI模型部署归档 | 高效码农

6个月前高效码农

像给高速列车加铺专用轨道：列车还是那辆列车，但再也不会在 128 K 站台上挨个查票。故事开场：当“长文本”变成“长队” 凌晨两点，小黎还在跟 GPU 对视。他只想让 671 B 参数的模型读完一 …

6个月前高效码农

“ 800亿参数、64专家MoE架构、自回归框架——这不仅仅是技术参数的堆砌，更是多模态理解与生成的一次彻底融合。还记得第一次使用文生图模型时的期待与落差吗？输入“一只在田野奔跑的小狗”，得到的可能 …

6个月前高效码农

TL;DR：DeepSeek-V3.1-Terminus 是 DeepSeek 系列在 V3.1 基础上面向 agent 能力与语言一致性的一次迭代，强化了 Search Agent / Code …

6个月前高效码农

什么是 Shimmy？ Shimmy 是一个仅有 5.1MB 的超轻量级工具，它能够在本地计算机上提供完全兼容 OpenAI 接口的 AI 模型服务。这意味着你可以使用现有的 AI 工具和应用程序，只 …

7个月前高效码农

混元翻译模型 Hunyuan-MT：7B 参数也能拿下 30 项第一，低资源语言翻译的新标杆 “能否用 7B 参数做出媲美 235B 大模型的翻译效果？” “藏语、维吾尔语、哈萨克语和蒙 …

8个月前高效码农

腾讯混元 0.5B/1.8B/4B/7B 小模型全攻略：从下载到部署，一篇就够对话式长文 | 适合专科及以上读者 | 基于官方 README 2025-08-04 版先回答你最关心的 3 个问题 …

9个月前高效码农

开源大模型全流程指南：从环境配置到微调实战引言：拥抱开源大模型的新时代在人工智能飞速发展的今天，大型语言模型（LLM）已成为技术创新的核心驱动力。不同于闭源商业模型，开源大模型以其透明性、可定制性 …

1年前高效码农

使用Llama Library在边缘设备上实现高效离线AI推理什么是Llama Library？ Llama Library 是一款专为边缘计算环境设计的AI推理库，支持本地化运行LLAMA及其他大 …