8.3B大模型塞进手机?LFM2-8B-A1B稀疏魔法引爆端侧AI革命

23小时前 高效码农

“MoE 只能堆在云端?”——Liquid AI 刚刚用一部手机推翻了这条金科玉律。 开场:当「大模型」不再等于「大算力」 凌晨 1 点,你窝在沙发改 PPT,手机突然弹出提醒: “需要把 200 页 …

8B大模型如何塞进手机?MiniCPM4飙速7倍秘籍曝光!

1个月前 高效码农

MiniCPM4 与 MiniCPM4.1:把 8B 大模型塞进手机,还能跑得快、想得深 适合读者:计算机/电子/通信相关专业毕业生,想快速了解「端侧大模型」到底做到了什么程度,以及自己能不能动手玩起 …

三步构建Cloudflare Serverless AI网关:零门槛接入Gemini与Imagen的终极方案

3个月前 高效码农

构建一个实用的 Cloudflare Serverless AI Worker:一站式接入 Gemini 与 Imagen 在构建现代化的 AI 应用过程中,开发者往往面临访问限制、密钥安全、延迟过高 …

picoLLM推理引擎:开源大模型本地化部署终极指南

6个月前 高效码农

picoLLM Inference Engine:突破本地化大语言模型推理的技术实践 一、为什么需要本地化LLM推理引擎? 在人工智能技术快速发展的今天,大语言模型(LLM)的应用已渗透到各个领域。然 …