Scaling Laws
Sharpness-Aware Minimization
Technique d'optimisation cherchant des minima plats dans le paysage de perte, particulièrement importante pour la stabilité des grands modèles.
← RetourTechnique d'optimisation cherchant des minima plats dans le paysage de perte, particulièrement importante pour la stabilité des grands modèles.
← Retour