混合精度計算
Precision Matrix Operations
計算の異なる部分が異なる精度を使用する線形演算(GEMM、畳み込み)のセット。一般的に、現代GPUでのスループットを最適化するために、FP16/BF16で乗算を行いFP32で累積します。
← 戻る計算の異なる部分が異なる精度を使用する線形演算(GEMM、畳み込み)のセット。一般的に、現代GPUでのスループットを最適化するために、FP16/BF16で乗算を行いFP32で累積します。
← 戻る