AI 词汇表
人工智能完整词典
Feature Importance
Métrique quantifiant l'influence de chaque variable prédictive dans la performance d'un modèle Random Forest, calculée soit par réduction d'impureté moyenne soit par permutation aléatoire.
Gini Importance
Méthode d'évaluation de l'importance des variables basée sur la diminution totale de l'impureté de Gini cumulée sur tous les nœuds où la variable est utilisée pour diviser.
Mean Decrease Impurity
Technique mesurant l'importance d'une variable par la réduction moyenne d'impureté (Gini ou entropie) qu'elle apporte lorsqu'elle est utilisée comme critère de division dans les arbres.
Permutation Importance
Méthode model-agnostic évaluant l'importance d'une variable en mesurant la dégradation de performance du modèle lorsque les valeurs de cette variable sont permutées aléatoirement.
Mean Decrease Accuracy
Indicateur de l'importance d'une variable basé sur la baisse moyenne de la précision du modèle lorsque cette variable est permutée dans les données out-of-bag.
Impurity Measure
Fonction mathématique quantifiant le degré d'hétérogénéité des classes dans un nœud, utilisée pour optimiser les divisions dans les arbres de décision.
Information Gain
Critère de division mesurant la réduction d'entropie obtenue en partitionnant un nœud selon une feature spécifique, favorisant les divisions maximisant l'homogénéité résultante.
Gini Index
Mesure d'impureté calculant la probabilité qu'une observation classée aléatoirement soit incorrecte, évaluant l'hétérogénéité des classes dans un nœud d'arbre de décision.
Out-of-Bag Error
Estimation d'erreur non biaisée calculée en évaluant chaque arbre sur les observations non utilisées lors de son entraînement, servant de validation croisée interne dans Random Forest.
Feature Selection
Processus d'identification et de conservation des variables les plus pertinentes basé sur leurs scores d'importance, éliminant les features redondantes ou non informatives.
Variable Importance Plot
Visualisation ordonnant les variables prédictives selon leur score d'importance décroissant, facilitant l'interprétation des facteurs les plus influents du modèle.
Partial Dependence Plot
Représentation graphique montrant l'effet marginal d'une ou deux variables sur la prédiction du modèle, en moyennant sur toutes les autres variables.
Node Impurity
Degré d'hétérogénéité des observations dans un nœud d'arbre, servant de base au calcul de l'importance des features via leur contribution à la réduction de cette impureté.
Split Criterion
Règle déterminant la division optimale d'un nœud en fonction d'une feature et d'un seuil, impactant directement la distribution de l'importance entre les variables.