人工智能知识库
Search
搜索
暗色模式
亮色模式
探索
标签: LLM微调
此标签下有2条笔记。
2026年4月24日
SFT监督微调与RLHF人类反馈强化学习
SFT
RLHF
LoRA
DPO
LLM微调
2026年4月18日
Unsloth使用指南
LLM微调
Unsloth
LoRA
QLoRA
高效训练
PyTorch
量化训练
GPU优化
模型训练
4-bit量化