联发科NPU逆袭:手机跑1600 token/s大模型,教你一招搞定端侧AI部署

13天前 高效码农

把 LLM 塞进手机:MediaTek NPU × LiteRT NeuroPilot Accelerator 全栈落地笔记 “ 核心问题:在碎片化边缘硬件上,怎样“一次训练、多端秒级部署”大模型,同 …

8B大模型如何塞进手机?MiniCPM4飙速7倍秘籍曝光!

3个月前 高效码农

MiniCPM4 与 MiniCPM4.1:把 8B 大模型塞进手机,还能跑得快、想得深 适合读者:计算机/电子/通信相关专业毕业生,想快速了解「端侧大模型」到底做到了什么程度,以及自己能不能动手玩起 …