Tensor Cores Optimization
Warp Matrix Multiply-Accumulate (WMMA)
API CUDA permettant aux warps de 32 threads d'effectuer efficacement des opérations de multiplication-accumulation matricielle directement sur les Tensor Cores avec accès aux registres fragmentés.
← Retour