🏠 Accueil
Benchmarks
📊 Tous les Benchmarks 🦖 Dinosaure v1 🦖 Dinosaure v2 ✅ To-Do List Apps 🎨 Pages Libres 🎯 FSACB - Showcase 🌍 Traduction
Modèles
🏆 Top 10 Modèles 🆓 Modèles Gratuits 📋 Tous les Modèles ⚙️ Modes Kilo Code
Ressources
💬 Prompts IA 📖 Glossaire IA 🔗 Liens Utiles

Glossaire IA

Le dictionnaire complet de l'Intelligence Artificielle

242
catégories
3 353
sous-catégories
40 780
termes
📖
termes

Stochastic Newton Method

Algorithme d'optimisation qui approxime la matrice Hessienne de manière stochastique pour accélérer la convergence, combinant l'efficacité computationnelle du SGD avec les propriétés de convergence d'ordre deux.

📖
termes

L-BFGS (Limited-memory BFGS)

Variante quasi-Newton qui approxime la matrice Hessienne inverse en utilisant uniquement les dernières m itérations, réduisant drastiquement la complexité mémoire tout en conservant les avantages d'ordre deux.

📖
termes

K-FAC (Kronecker-Factored Approximate Curvature)

Méthode d'optimisation second ordre qui approxime la matrice de Fisher par un produit de Kronecker de matrices plus petites, permettant des calculs efficaces pour les réseaux de neurones profonds.

📖
termes

Natural Gradient Descent

Algorithme d'optimisation qui utilise la métrique de l'information de Fisher comme préconditionneur, garantissant une convergence invariante aux reparamétrisations du modèle.

📖
termes

AdaHessian

Optimiseur adaptatif qui estime la diagonale de la matrice Hessienne en utilisant une approximation Hutchinson, adaptant le taux d'apprentissage pour chaque paramètre basé sur la courbure locale.

📖
termes

Shampoo Optimizer

Optimiseur second ordre qui préconditionne les gradients en utilisant des approximations de matrices de Kronecker pour les tenseurs de poids, adaptatif à la structure des paramètres du modèle.

📖
termes

LAMB (Layer-wise Adaptive Moments optimizer)

Optimiseur adaptatif qui ajuste le taux d'apprentissage par couche en utilisant la norme des poids et des gradients, combinant les avantages d'Adam avec une adaptation spécifique à la structure du réseau.

📖
termes

Sophia Optimizer

Méthode d'optimisation second ordre qui combine des estimations de Hessienne diagonale avec un contrôle d'élan stochastique, adaptant dynamiquement la direction de mise à jour selon la courbure locale.

📖
termes

Sub-sampled Newton Method

Variante de Newton qui utilise des sous-ensembles de données pour estimer le gradient et la Hessienne, réduisant la complexité computationnelle tout en préservant les propriétés de convergence quadratique locale.

📖
termes

Stochastic Quasi-Newton

Classe d'algorithmes qui maintiennent une approximation de l'inverse de la Hessienne mise à jour de manière stochastique, équilibrant la complexité computationnelle et le taux de convergence.

📖
termes

Diagonal Gauss-Newton

Approximation de la Hessienne qui utilise seulement les éléments diagonaux de la matrice de Gauss-Newton, réduisant significativement les coûts computationnels pour les problèmes de grande dimension.

📖
termes

TNSR (Tensor Normalized Second-order Regularization)

Méthode qui applique une régularisation second ordre en normalisant les tenseurs de gradients selon les estimations de courbure, stabilisant l'entraînement des réseaux profonds.

📖
termes

Online Newton Step

Algorithme d'optimisation en ligne qui maintient une approximation de la Hessienne inverse pour adapter dynamiquement les mises à jour des paramètres selon les observations séquentielles.

📖
termes

Stochastic Recursive Gradient Algorithm

Méthode qui utilise des techniques de récursivité pour approximer efficacement les informations de second ordre tout en maintenant la complexité linéaire du SGD classique.

🔍

Aucun résultat trouvé