量子化と最適化
量子化グリッドサーチ最適化
特定のアーキテクチャにおいて、モデルサイズ、速度、精度の間で最適なバランスを提供する最適なスキームを特定するために、異なる量子化構成(層ごと、グループごと、混合など)を体系的に探索する手法。
← 戻る特定のアーキテクチャにおいて、モデルサイズ、速度、精度の間で最適なバランスを提供する最適なスキームを特定するために、異なる量子化構成(層ごと、グループごと、混合など)を体系的に探索する手法。
← 戻る