Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Régression Linéaire Simple
Modèle statistique qui établit une relation linéaire entre une seule variable explicative et une variable cible continue sous la forme Y = β₀ + β₁X + ε.
Régression Linéaire Multiple
Extension de la régression linéaire utilisant plusieurs variables explicatives pour prédire une variable cible continue selon Y = β₀ + ΣβᵢXᵢ + ε.
Coefficient de Détermination (R²)
Métrique statistique variant de 0 à 1 mesurant la proportion de variance de la variable cible expliquée par le modèle de régression.
Moindres Carrés Ordinaires (MCO)
Méthode d'estimation des paramètres de régression minimisant la somme des carrés des résidus entre valeurs observées et prédites.
Résidus
Différences entre les valeurs observées et les valeurs prédites par le modèle de régression, représentant les erreurs de prédiction.
Multicolinéarité
Phénomène où plusieurs variables explicatives sont fortement corrélées entre elles, rendant l'estimation des coefficients instable.
Hétéroscédasticité
Violation de l'hypothèse d'homoscédasticité où la variance des résidus n'est pas constante à travers les niveaux de variables explicatives.
Valeurs Influentes
Observations qui, si retirées de l'ensemble de données, provoqueraient des changements substantiels dans les estimations des coefficients.
Distance de Cook
Statistique mesurant l'influence d'une observation individuelle sur les valeurs prédites du modèle de régression.
Régression Ridge
Technique de régularisation ajoutant une pénalité L2 aux coefficients pour réduire la variance et traiter la multicolinéarité.
Régression LASSO
Méthode de régularisation utilisant une pénalité L1 qui peut réduire certains coefficients exactement à zéro, effectuant une sélection de variables.
Biais-Variance Tradeoff
Compromis fondamental entre l'erreur de biais (simplification excessive) et l'erreur de variance (surtension aux données d'entraînement).
Descente de Gradient
Algorithme d'optimisation itératif ajustant les coefficients pour minimiser la fonction de coût en suivant la direction du gradient négatif.
Intervalle de Prédiction
Plage de valeurs probables contenant la future observation individuelle avec un niveau de confiance spécifié, plus large que l'intervalle de confiance.
Test de Significativité
Test statistique évaluant si un coefficient de régression diffère significativement de zéro, généralement utilisant la statistique t.