人工智能知识库
Search
搜索
暗色模式
亮色模式
探索
Home
❯
人工智能工具实操
❯
大模型调用
❯
评估与优化
文件夹: 人工智能工具实操/大模型调用/评估与优化
此文件夹下有5条笔记。
2026年4月24日
_Index
评估
LM_Eval
幻觉
压缩
蒸馏
剪枝
量化
推理优化
KV_Cache
投机解码
2026年4月18日
LM Eval评估框架
大模型评估
LM-Evaluation-Harness
基准测试
MMLU
GSM8K
BIG-Bench
模型评测
2026年4月18日
幻觉评估方法
幻觉检测
Hallucination
事实性评估
BLEU
ROUGE
BERTScore
人类评估
生成质量
2026年4月18日
推理优化技术
KV-Cache
投机解码
Speculative-Decoding
Continuous-Batching
CUDA-Graph
推理优化
vLLM
TensorRT-LLM
2026年4月18日
模型压缩技术
知识蒸馏
剪枝
Pruning
权重量化
Quantization
模型压缩
INT8
INT4
模型部署