Feature importance et sélection

📖

termen

Gain d'Impureté (Impurity Gain)

Critère de sélection de variable dans les arbres de décision mesurant la réduction de l'impureté (ex: indice de Gini ou entropie) apportée par le partitionnement d'un nœud selon une caractéristique donnée.

📖

termen

Poids de Gini (Gini Importance)

Mesure d'importance spécifique aux forêts aléatoires, calculée comme la réduction moyenne de l'impureté de Gini apportée par une variable sur tous les arbres de la forêt.

📖

termen

Récursivité de Feature (Feature Recursion)

Concept dans les modèles à base d'arbres où l'importance d'une variable est influencée par sa capacité à être sélectionnée à plusieurs niveaux de profondeur, y compris dans des sous-arbres créés par d'autres variables.

📖

termen

Importance par Réduction de l'Erreur (Drop Column Importance)

Méthode d'évaluation de l'importance qui consiste à ré-entraîner le modèle après avoir retiré une variable et à mesurer la dégradation de sa performance par rapport au modèle de référence complet.

📖

termen

Valeur SHAP (SHAP Value)

Score quantitatif attribué par la méthode SHAP à une caractéristique pour une prédiction individuelle, représentant sa contribution marginale à la différence entre la prédiction du modèle et la prédiction moyenne de l'ensemble de données.

📖

termen

Force Plot SHAP (SHAP Force Plot)

Visualisation spécifique à SHAP illustrant comment les valeurs SHAP de chaque caractéristique poussent la prédiction du modèle de la valeur de base (moyenne) vers la valeur de sortie finale pour une observation unique.

📖

termen

Importance Globale vs Locale

Distinction fondamentale en interprétabilité où l'importance globale évalue l'impact d'une variable sur l'ensemble du modèle, tandis que l'importance locale explique sa contribution pour une prédiction spécifique.

📖

termen

Sélection de Variables par Importance

Processus de réduction de dimensionnalité utilisant les scores d'importance des caractéristiques pour éliminer les variables non pertinentes ou redondantes, visant à améliorer la performance et l'interprétabilité du modèle.

📖

termen

Coefficients de Régression LASSO

Dans le contexte de la sélection, les coefficients d'un modèle LASSO (Least Absolute Shrinkage and Selection Operator) servent d'indicateur d'importance, car la pénalisation L1 peut réduire certains coefficients à exactement zéro, éliminant ainsi les variables correspondantes.

📖

termen

Importance par Surrogates (Surrogate Importance)

Méthode d'évaluation de l'importance dans les modèles à base d'arbres qui mesure la capacité d'une variable à servir de substitut (surrogate split) à la variable de division principale pour partitionner les données, indiquant une information redondante mais pertinente.

📖

termen

Importance par Sensibilité (Sensitivity Analysis)

Approche évaluant l'importance d'une variable en analysant comment les variations de ses valeurs influencent la sortie du modèle, souvent par le calcul de dérivées partielles ou par des simulations de Monte Carlo.

AI-woordenlijst

Gain d'Impureté (Impurity Gain)

Poids de Gini (Gini Importance)

Récursivité de Feature (Feature Recursion)

Importance par Réduction de l'Erreur (Drop Column Importance)

Valeur SHAP (SHAP Value)

Force Plot SHAP (SHAP Force Plot)

Importance Globale vs Locale

Sélection de Variables par Importance

Coefficients de Régression LASSO

Importance par Surrogates (Surrogate Importance)

Importance par Sensibilité (Sensitivity Analysis)

Geen resultaten gevonden