モデルの最適化
推論最適化
本番環境でのモデル予測フェーズにおけるレイテンシと計算コストを削減するための技術群。量子化、特定のハードウェアアクセラレータ(TPU、GPU)向けのコンパイル、計算グラフの最適化などを含む。
← 戻る本番環境でのモデル予測フェーズにおけるレイテンシと計算コストを削減するための技術群。量子化、特定のハードウェアアクセラレータ(TPU、GPU)向けのコンパイル、計算グラフの最適化などを含む。
← 戻る