Non-convex Optimization
Sharp vs Flat Minima
Distinction entre minima locaux avec courbure élevée (sharp) potentiellement moins généralisables et ceux à courbure faible (flat) généralement préférables pour la généralisation.
← Kembali