Optimización de Tensor Cores
Multiplicación-Acumulación de Matrices Warp (WMMA)
API CUDA que permite a los warps de 32 hilos realizar eficientemente operaciones de multiplicación-acumulación matricial directamente en los Tensor Cores con acceso a registros fragmentados.
← Volver