量子化と圧縮
構造化プルーニング
個々の重みではなく、フィルター、チャネル、アテンションヘッドなどの重み構造全体を削除する圧縮技術。非構造化プルーニングよりも現代のハードウェアでの計算を高速化するのに効果的です。
← 戻る個々の重みではなく、フィルター、チャネル、アテンションヘッドなどの重み構造全体を削除する圧縮技術。非構造化プルーニングよりも現代のハードウェアでの計算を高速化するのに効果的です。
← 戻る