Civilization Museum
The Dark Forest
目录
0%
概述
剪枝方法分类
剪枝粒度
剪枝时机
权重重要性评估准则
基于幅值的剪枝
局限性
基于梯度的剪枝
计算逻辑
核心优势
局限性
代表方法与场景
二阶信息剪枝(Second-order Information Pruning)
核心定义
计算逻辑
核心优势
局限性
代表方法与场景
基于激活的剪枝(Activation-based Pruning)
核心定义
常见实现形式
核心优势
局限性
代表方法与场景
任务驱动剪枝(Task-aware / Scoring-based Pruning)
核心定义
常见实现形式
核心优势
局限性
代表方法与场景
非结构化剪枝
OBD
计算流程
OBS
OBD问题
损失函数
推导
计算流程
OBC
OBS问题
损失函数
推导
计算流程
SparseGPT
OBS问题
原理
Wanda
结构化剪枝
大语言模型
注意力头剪枝(Attention Head Pruning)
MLP层剪枝(MLP Neuron Pruning)
层级剪枝(Layer Pruning)
全参数非结构化剪枝
5.3 大模型剪枝的专属挑战
六、领域核心挑战与研究建议(翻译整理)
0%