AI对齐归档 | 高效码农

3个月前高效码农

大语言模型的“助手轴”：为什么模型会“跑偏”，以及如何让它稳定下来摘要大语言模型在后训练阶段被塑造成默认的“helpful Assistant”（乐于助人的助手）角色，但这个角色其实只是激活空间中 …

11个月前高效码农

WorldPM技术解析：基于1500万论坛数据的人类偏好建模系统（图片来源：Unsplash，展示AI对齐概念）一、技术原理剖析 1.1 核心架构设计 WorldPM（World Preferen …