混合精度计算
TF32 (TensorFloat-32)
NVIDIA专有的19位混合格式,结合了FP16的8位指数和FP32的10位尾数,针对Ampere和Hopper架构GPU上Tensor Core的矩阵运算进行了优化。
← 返回NVIDIA专有的19位混合格式,结合了FP16的8位指数和FP32的10位尾数,针对Ampere和Hopper架构GPU上Tensor Core的矩阵运算进行了优化。
← 返回