拡散モデルのファインチューニング
ファインチューニング重みの量子化
ファイルサイズとメモリ使用量を削減するために、ファインチューニングモデルの重みの数値精度(例:FP32からFP16またはINT8へ)を低減する技術。通常、わずかな品質低下を伴う。
← 戻るファイルサイズとメモリ使用量を削減するために、ファインチューニングモデルの重みの数値精度(例:FP32からFP16またはINT8へ)を低減する技術。通常、わずかな品質低下を伴う。
← 戻る