**对抗训练:**使用两种模型对齐,一个生成偏离人类偏好的内容,另一个将其识别出来并惩罚。
**用户交互:**DeRa 需要用户输入以调整对齐强度,这可能不适用于所有应用程序。
京ICP备14003405号-6