LoRA 归档 | 高效码农

6个月前高效码农

想象一下，你正盯着屏幕，手里握着一杯凉透了的咖啡。作为一个AI开发者，你刚刚又一次目睹了强化学习（RL）训练的惨剧：一台价值不菲的H100 GPU内存告急，32B参数的LLM模型在rollout阶段卡 …

10个月前高效码农

LoRA技术解析：大模型微调进入单卡GPU时代引言：突破算力壁垒的技术革命当大型语言模型（LLM）成为人工智能领域的核心基础设施，其微调成本却筑起了高墙。传统方法微调BERT需更新1.1亿参数，G …