微调技术 (Fine-Tuning Techniques)

本目录系统梳理大语言模型微调技术的完整知识体系,涵盖从全参数微调到各类高效参数微调方法的核心原理、实践指南与技术对比。


目录结构

全参数微调 (Full Parameter Fine-Tuning)

  • 全参数微调 — 传统全量参数更新方法,覆盖成本与适用场景

高效参数微调 (Parameter-Efficient Fine-Tuning, PEFT)

方法核心文档说明
LoRALoRA微调深度指南低秩适配器原理、秩选择、目标模块配置
QLoRAQLoRA微调详解量化感知微调,4-bit NF4量化 + LoRA组合方案
P-TuningP-Tuning微调连续提示学习,前缀嵌入与提示编码器设计
AdapterAdapter微调瓶颈Adapter结构,投影层插入策略
Prefixprefix微调连续前缀向量,可学习上下文前缀设计

技术综合


核心主题关联

graph TD
    A[预训练模型] --> B[全参数微调]
    A --> C[高效参数微调 PEFT]
    C --> D[LoRA / QLoRA]
    C --> E[P-Tuning / Prefix Tuning]
    C --> F[Adapter Tuning]
    B --> G[下游任务适配]
    D --> G
    E --> G
    F --> G

选型建议


相关知识节点