Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Courbe de validation
Graphique montrant les performances du modèle sur un ensemble de validation distinct en parallèle de la courbe d'apprentissage pour détecter le surapprentissage.
Point de convergence
Moment où les courbes d'apprentissage et de validation se stabilisent, indiquant que l'ajout de données supplémentaires n'améliorera plus significativement les performances.
Gap de généralisation
Différence entre les performances sur les données d'entraînement et les données de validation, mesurant la capacité du modèle à généraliser à de nouvelles données.
Erreur d'apprentissage
Mesure de l'erreur commise par le modèle sur l'ensemble d'entraînement, servant de référence pour évaluer le surapprentissage potentiel.
Erreur de validation
Performance du modèle évaluée sur un ensemble de données non utilisées pendant l'entraînement, reflétant sa capacité de généralisation réelle.
Plateau d'apprentissage
Phase où l'ajout de données d'entraînement supplémentaires ne produit plus d'amélioration significative des performances du modèle.
Diagnostic de biais
Analyse de la courbe d'apprentissage pour déterminer si le modèle souffre d'un sous-apprentissage (biais élevé) nécessitant un modèle plus complexe.
Diagnostic de variance
Identification d'un surapprentissage (variance élevé) lorsque l'erreur d'entraînement est faible mais l'erreur de validation reste élevée.
Complexité du modèle
Facteur influençant la forme de la courbe d'apprentissage, où un modèle trop complexe tend à surapprendre tandis qu'un modèle trop simple sous-apprend.
Taille critique d'échantillon
Nombre minimum de données d'entraînement nécessaires pour atteindre des performances stables et généralisables du modèle.
Courbe d'apprentissage par classe
Analyse séparée des courbes d'apprentissage pour chaque classe de sortie, particulièrement utile dans les problèmes de classification déséquilibrés.
Taux d'amélioration marginale
Mesure du gain de performance obtenu par l'ajout d'unités supplémentaires de données d'entraînement, aidant à décider de la pertinence de collecter plus de données.
Validation croisée itérative
Technique combinant validation croisée et courbes d'apprentissage pour évaluer robustement la performance à différentes tailles d'échantillon.
Bruit dans les données
Erreur aléatoire dans les données d'entraînement qui affecte la forme de la courbe d'apprentissage et limite les performances atteignables du modèle.