Second-order Stochastic Methods
LAMB (Layer-wise Adaptive Moments optimizer)
Optimiseur adaptatif qui ajuste le taux d'apprentissage par couche en utilisant la norme des poids et des gradients, combinant les avantages d'Adam avec une adaptation spécifique à la structure du réseau.
← 뒤로