人工智能知识库
Search
搜索
暗色模式
亮色模式
探索
标签: ORPO
此标签下有1条笔记。
2026年4月18日
ORPO对齐
RLHF
ORPO
对齐
比值比优化
单阶段训练
大模型训练