Computação de Precisão Mista
Precision Matrix Operations (Operações de Matriz de Precisão)
Conjunto de operações lineares (GEMM, convolução) onde diferentes partes do cálculo utilizam diferentes precisões – tipicamente acumulação em FP32 com multiplicação em FP16/BF16 para otimizar o throughput em GPUs modernas.
← Voltar