Stochastic Optimization and SGD

📂

sottocategorie

Stochastic Gradient Descent (SGD)

Algorithme d'optimisation de base qui met à jour les paramètres en utilisant un échantillon aléatoire à chaque itération.

7 termini

📂

sottocategorie

Mini-batch Gradient Descent

Variant of SGD that uses small batches of samples to balance variance and computational efficiency.

3 termini

📂

sottocategorie

Momentum-based Optimization

Techniques incorporant une inertie pour accélérer la convergence et réduire les oscillations dans les vallées étroites.

14 termini

📂

sottocategorie

Adaptive Learning Rate Methods

Algorithmes comme Adam et RMSprop qui ajustent dynamiquement le taux d'apprentissage pour chaque paramètre.

9 termini

📂

sottocategorie

Variance Reduction Techniques

Méthodes comme SVRG et SAGA qui réduisent la variance des estimations de gradient pour améliorer la convergence.

14 termini

📂

sottocategorie

Distributed SGD

Approaches parallelizing SGD across multiple machines to accelerate large-scale model training.

9 termini

📂

sottocategorie

Non-convex Optimization

Techniques spécialisées pour l'optimisation de fonctions non-convexes typiques dans les réseaux de neurones profonds.

13 termini

📂

sottocategorie

Learning Rate Scheduling

Stratégies d'ajustement du taux d'apprentissage pendant l'entraînement pour optimiser la convergence.

13 termini

📂

sottocategorie

Second-order Stochastic Methods

Algorithmes utilisant des informations de deuxième ordre approximatives pour accélérer la convergence.

14 termini

📂

sottocategorie

Federated Learning Optimization

Méthodes SGD adaptées pour l'entraînement distribué préservant la confidentialité sur des données décentralisées.

3 termini

📂

sottocategorie

Robust Stochastic Optimization

Techniques rendant l'optimisation résiliente aux données bruitées et aux attaques adversariales.

3 termini

📂

sottocategorie

Online Learning Optimization

Variantes SGD adaptées aux scénarios où les données arrivent séquentiellement et nécessitent des mises à jour continues.

6 termini

Glossario IA

Stochastic Gradient Descent (SGD)

Mini-batch Gradient Descent

Momentum-based Optimization

Adaptive Learning Rate Methods

Variance Reduction Techniques

Distributed SGD

Non-convex Optimization

Learning Rate Scheduling

Second-order Stochastic Methods

Federated Learning Optimization

Robust Stochastic Optimization

Online Learning Optimization

Nessun risultato trovato