模型部署归档 | 高效码农

2个月前高效码农

GLM-4.7-Flash：本地部署高性能30B专家混合模型完全指南 GLM-4.7-Flash模型图标在当今的AI领域，大语言模型已成为开发者和研究人员的得力助手。而今天，我们将深入 …

3个月前高效码农

HyperVL：让手机也能流畅运行的多模态大模型，是怎么做到的？你是否曾幻想过，在你的手机上，有一个像ChatGPT一样聪明的助手，不仅能和你聊天，还能“看懂”你相册里的照片、理解屏幕截图、甚至帮你 …

3个月前高效码农

🚀 拥抱全能时代：vLLM-Omni 如何轻松、高效、低成本地服务全模态大模型自从大型语言模型（LLM）问世以来，AI 的发展速度令人惊叹。然而，当下的前沿模型已不再局限于传统的“文本输入、文本输出 …

4个月前高效码农

Nemotron Elastic：一次训练，三模型部署的弹性推理架构革命核心问题：为什么我们需要一种新的模型压缩范式？当企业需要在手机、边缘服务器和云端数据中心部署同一模型的不同版本时，传统方法要 …

4个月前高效码农

开源盘古 Ultra-MoE-718B-V1.1：高效混合专家模型的实践指南本文核心问题：如何快速上手一个总参数量达718B的混合专家语言模型，并在昇腾NPU上实现高效推理？开源盘古 Ultra- …

5个月前高效码农

想象一下，你正坐在咖啡馆里，笔记本电脑上运行着一个AI助手，它能瞬间总结一份长达上百页的报告，却不会让你的电池瞬间见底。更酷的是，这个助手完全运行在你的手机上，不用担心数据泄露或网络延迟 …

6个月前高效码农

MiniCPM4 与 MiniCPM4.1：把 8B 大模型塞进手机，还能跑得快、想得深适合读者：计算机/电子/通信相关专业毕业生，想快速了解「端侧大模型」到底做到了什么程度，以及自己能不能动手玩起 …

7个月前高效码农

深入解析 DeepSeek-V3.1：如何在个人设备上运行强大的混合推理模型 ❝ 还在为无法本地运行大模型而烦恼吗？DeepSeek-V3.1 的量化版本让你在消费级硬件上也能体验前沿AI技术 ❞ 近 …

7个月前高效码农

vLLM CLI：高效管理大语言模型服务的命令行工具如果你经常需要部署、管理大语言模型，可能会遇到这些问题：不知道如何快速启动模型服务、多模型切换时配置繁琐、不清楚服务器运行状态……今天要介绍的vL …

7个月前高效码农

腾讯混元 0.5B/1.8B/4B/7B 小模型全攻略：从下载到部署，一篇就够对话式长文 | 适合专科及以上读者 | 基于官方 README 2025-08-04 版先回答你最关心的 3 个问题 …