Mixed Precision Computing
Dynamic Loss Scaling
Variante adaptative du loss scaling où le facteur d'échelle est ajusté dynamiquement pendant l'entraînement, augmentant en cas de stabilité et réduisant en cas d'overflow pour optimiser la convergence.
← पीछे