人工智能知识库

Home

❯

人工智能工具实操

❯

大模型调用

❯

数据处理

文件夹: 人工智能工具实操/大模型调用/数据处理

此文件夹下有6条笔记。

  • 2026年4月18日

    数据处理索引

    • index
    • 数据处理
    • 训练数据
    • LLM
  • 2026年4月18日

    数据增强方法

    • 数据增强
    • 回译增强
    • 语义等价
    • 合成数据
    • 课程学习
    • 数据混合
  • 2026年4月18日

    数据收集指南

    • 大模型微调
    • 数据工程
    • 数据收集
    • 开源数据集
  • 2026年4月18日

    数据标注最佳实践

    • 数据标注
    • 质量控制
    • 众包标注
    • 标注平台
    • 标注任务设计
  • 2026年4月18日

    数据格式化与Tokenization

    • 数据格式化
    • Tokenization
    • ChatML
    • ShareGPT
    • 分词器配置
    • 特殊Token
    • 上下文管理
    • 数据集打包
  • 2026年4月18日

    数据清洗技术

    • 数据清洗
    • 数据质量
    • 去重技术
    • 质量评分
    • 毒性过滤
    • 数据分布

Created with Quartz v4.5.2 © 2026

  • GitHub