AI-woordenlijst
Het complete woordenboek van kunstmatige intelligentie
Gain d'Impureté (Impurity Gain)
Critère de sélection de variable dans les arbres de décision mesurant la réduction de l'impureté (ex: indice de Gini ou entropie) apportée par le partitionnement d'un nœud selon une caractéristique donnée.
Poids de Gini (Gini Importance)
Mesure d'importance spécifique aux forêts aléatoires, calculée comme la réduction moyenne de l'impureté de Gini apportée par une variable sur tous les arbres de la forêt.
Récursivité de Feature (Feature Recursion)
Concept dans les modèles à base d'arbres où l'importance d'une variable est influencée par sa capacité à être sélectionnée à plusieurs niveaux de profondeur, y compris dans des sous-arbres créés par d'autres variables.
Importance par Réduction de l'Erreur (Drop Column Importance)
Méthode d'évaluation de l'importance qui consiste à ré-entraîner le modèle après avoir retiré une variable et à mesurer la dégradation de sa performance par rapport au modèle de référence complet.
Valeur SHAP (SHAP Value)
Score quantitatif attribué par la méthode SHAP à une caractéristique pour une prédiction individuelle, représentant sa contribution marginale à la différence entre la prédiction du modèle et la prédiction moyenne de l'ensemble de données.
Force Plot SHAP (SHAP Force Plot)
Visualisation spécifique à SHAP illustrant comment les valeurs SHAP de chaque caractéristique poussent la prédiction du modèle de la valeur de base (moyenne) vers la valeur de sortie finale pour une observation unique.
Importance Globale vs Locale
Distinction fondamentale en interprétabilité où l'importance globale évalue l'impact d'une variable sur l'ensemble du modèle, tandis que l'importance locale explique sa contribution pour une prédiction spécifique.
Sélection de Variables par Importance
Processus de réduction de dimensionnalité utilisant les scores d'importance des caractéristiques pour éliminer les variables non pertinentes ou redondantes, visant à améliorer la performance et l'interprétabilité du modèle.
Coefficients de Régression LASSO
Dans le contexte de la sélection, les coefficients d'un modèle LASSO (Least Absolute Shrinkage and Selection Operator) servent d'indicateur d'importance, car la pénalisation L1 peut réduire certains coefficients à exactement zéro, éliminant ainsi les variables correspondantes.
Importance par Surrogates (Surrogate Importance)
Méthode d'évaluation de l'importance dans les modèles à base d'arbres qui mesure la capacité d'une variable à servir de substitut (surrogate split) à la variable de division principale pour partitionner les données, indiquant une information redondante mais pertinente.
Importance par Sensibilité (Sensitivity Analysis)
Approche évaluant l'importance d'une variable en analysant comment les variations de ses valeurs influencent la sortie du modèle, souvent par le calcul de dérivées partielles ou par des simulations de Monte Carlo.