AI用語集
人工知能の完全辞典
236
カテゴリ
3,245
サブカテゴリ
39,334
用語
用語
重みの量子化
モデルの重みの精度のみを削減し、アクティベーションは完全精度を維持することで、パフォーマンスと速度の最適なバランスを実現します。
用語
アクティベーションの量子化
重みに加えてアクティベーション(層の出力)の精度も削減するプロセスで、モデルの最大限の最適化を実現します。
用語
8ビット量子化
モデルのパラメータを32ビットまたは16ビットから8ビットに変換し、メモリを75%削減しながら精度への影響は中程度です。
用語
4ビット量子化
4ビットへの極端な削減技術で、大幅なメモリ削減を実現しますが、パフォーマンスを維持するには高度なアルゴリズムが必要です。
用語
動的量子化
推論中に動的に適用される量子化で、入力データに応じて量子化パラメータをリアルタイムで調整します。
用語
静的量子化
固定されたキャリブレーションセットで量子化パラメータを事前計算し、速度を最適化しますが、代表的なデータが必要です。
🔍