人工智能知识库

❯

人工智能工具实操

❯

大模型调用

❯

文件夹: 人工智能工具实操/大模型调用/RLHF与对齐

此文件夹下有7条笔记。

2026年4月18日
Constitutional_AI详解
2026年4月18日
DPO深度指南
2026年4月18日
KTO对齐
2026年4月18日
ORPO对齐
2026年4月18日
PPO训练详解
2026年4月18日
RLHF与对齐索引
2026年4月18日
偏好数据构建

Created with Quartz v4.5.2 © 2026

GitHub