Otimização de Tensor Cores
Warp Matrix Multiply-Accumulate (WMMA)
API CUDA que permite que warps de 32 threads realizem eficientemente operações de multiplicação-acumulação de matrizes diretamente nos Tensor Cores com acesso a registradores fragmentados.
← Voltar