Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Sélection de Caractéristiques
Processus de sélection automatique des variables les plus pertinentes pour construire un modèle prédictif optimal, en réduisant la dimensionnalité et en améliorant la généralisation.
Méthodes de Filtrage
Techniques de sélection de caractéristiques indépendantes du modèle, évaluant chaque variable individuellement selon des critères statistiques avant l'entraînement.
Méthodes d'Enveloppement
Approches de sélection utilisant le modèle prédictif pour évaluer les sous-ensembles de caractéristiques, souvent plus précises mais computeralement intensives.
Méthodes Intégrées
Stratégies combinant sélection et apprentissage, où le processus de sélection est intégré directement dans l'algorithme d'entraînement du modèle.
Élimination Récursive de Caractéristiques
Algorithme itératif supprimant progressivement les caractéristiques les moins importantes en réentraînant le modèle à chaque étape jusqu'à atteindre le nombre optimal de variables.
Information Mutuelle
Mesure quantifiant la dépendance statistique entre deux variables, utilisée pour évaluer la pertinence des caractéristiques par rapport à la variable cible.
Seuil de Variance
Technique de filtrage élémentaire éliminant les caractéristiques dont la variance est inférieure à un seuil prédéfini, considérées comme peu informatives.
Test Khi-deux
Test statistique évaluant l'indépendance entre variables catégorielles, utilisé pour mesurer la pertinence des caractéristiques qualitatives par rapport à la cible.
Test F ANOVA
Test statistique comparant les variances entre groupes pour évaluer la relation entre caractéristiques numériques et variables cibles catégorielles.
Coefficient de Corrélation
Mesure statistique quantifiant l'intensité et la direction de la relation linéaire entre deux variables, utilisée pour détecter la multicollinéarité.
Sélection Séquentielle
Méthode gloutonne ajoutant (forward) ou supprimant (backward) séquentiellement des caractéristiques pour optimiser une métrique de performance du modèle.
Algorithme Boruta
Méthode wrapper basée sur les forêts aléatoires identifiant toutes les caractéristiques pertinentes en comparant leur importance à des variables shadow aléatoires.
Importance par Permutation
Technique model-agnostic évaluant l'importance des caractéristiques en mesurant la dégradation de performance après permutation aléatoire de leurs valeurs.
Algorithme Relief
Méthode de filtrage évaluant la pertinence des caractéristiques en mesurant leur capacité à distinguer les instances voisines de classes différentes.