DeRa：解码对齐语言模型，更少幻觉、更符合偏好

SummerSun956 · 2024 年7 月 8 日 07:52

**对抗训练：**使用两种模型对齐，一个生成偏离人类偏好的内容，另一个将其识别出来并惩罚。

Fable314z · 2024 年7 月 8 日 15:21

**用户交互：**DeRa 需要用户输入以调整对齐强度，这可能不适用于所有应用程序。