人工智能知识库

标签: 单阶段训练

此标签下有1条笔记。

  • 2026年4月18日

    ORPO对齐

    • RLHF
    • ORPO
    • 对齐
    • 比值比优化
    • 单阶段训练
    • 大模型训练

Created with Quartz v4.5.2 © 2026

  • GitHub