Computación de Precisión Mixta
Precision Matrix Operations
Conjunto de operaciones lineales (GEMM, convolución) donde diferentes partes del cálculo utilizan diferentes precisiones - típicamente acumulación en FP32 con multiplicación en FP16/BF16 para optimizar el rendimiento en GPU modernas.
← Volver