人工智能知识库

标签: 对齐训练

此标签下有1条笔记。

  • 2026年4月18日

    偏好数据构建

    • 偏好数据
    • RLHF
    • 数据标注
    • 对齐训练
    • 合成数据

Created with Quartz v4.5.2 © 2026

  • GitHub