人工智能知识库

Home

❯

人工智能工具实操

❯

大模型调用

❯

评估与优化

文件夹: 人工智能工具实操/大模型调用/评估与优化

此文件夹下有5条笔记。

  • 2026年4月24日

    _Index

    • 评估
    • LM_Eval
    • 幻觉
    • 压缩
    • 蒸馏
    • 剪枝
    • 量化
    • 推理优化
    • KV_Cache
    • 投机解码
  • 2026年4月18日

    LM Eval评估框架

    • 大模型评估
    • LM-Evaluation-Harness
    • 基准测试
    • MMLU
    • GSM8K
    • BIG-Bench
    • 模型评测
  • 2026年4月18日

    幻觉评估方法

    • 幻觉检测
    • Hallucination
    • 事实性评估
    • BLEU
    • ROUGE
    • BERTScore
    • 人类评估
    • 生成质量
  • 2026年4月18日

    推理优化技术

    • KV-Cache
    • 投机解码
    • Speculative-Decoding
    • Continuous-Batching
    • CUDA-Graph
    • 推理优化
    • vLLM
    • TensorRT-LLM
  • 2026年4月18日

    模型压缩技术

    • 知识蒸馏
    • 剪枝
    • Pruning
    • 权重量化
    • Quantization
    • 模型压缩
    • INT8
    • INT4
    • 模型部署

Created with Quartz v4.5.2 © 2026

  • GitHub