Glossario IA
Il dizionario completo dell'Intelligenza Artificiale
Erreur quadratique
Critère de split utilisé dans les arbres CART de régression, minimisant la somme des carrés des écarts entre les valeurs observées et la moyenne prédite dans chaque nœud enfant.
Critère de split optimal
Combinaison variable-seuil sélectionnée parmi toutes les possibilités qui maximise la réduction d'impureté (Gini) ou minimise l'erreur quadratique pour créer les partitions les plus homogènes.
Complexité minimale
Principe fondamental de CART privilégiant l'arbre le plus simple ayant la même performance prédictive qu'un arbre plus complexe, contrôlé par le paramètre de pénalité alpha dans l'élagage.
Matrice de confusion CART
Tableau d'évaluation spécifique aux arbres CART de classification croisant les classes prédites et réelles pour calculer les taux d'erreur par classe et le taux d'erreur global.
Variable de split
Caractéristique sélectionnée à chaque nœud pour partitionner les données, choisie parmi toutes les variables disponibles en fonction de sa capacité à maximiser l'homogénéité résultante.
Seuil optimal
Valeur numérique continue qui divise les données en deux groupes maximisant la réduction d'impureté de Gini ou minimisant l'erreur quadratique dans le contexte CART.
Arbre de régression CART
Variante CART spécialisée dans la prédiction de variables continues utilisant l'erreur quadratique comme critère de division et la moyenne comme prédiction dans les feuilles terminales.
Arbre de classification CART
Version CART conçue pour les variables catégorielles utilisant l'indice de Gini comme mesure d'impureté et la classe majoritaire comme prédiction dans chaque nœud terminal.
Surapprentissage CART
Phénomène où l'arbre CART devient trop complexe en mémorisant les particularités du jeu d'entraînement, nécessitant un élagage pour améliorer la généralisation sur de nouvelles données.
Échantillonnage CART
Processus de partitionnement récursif des données d'entraînement en sous-ensembles de plus en plus purs jusqu'à atteindre un critère d'arrêt prédéfini.
Validation croisée CART
Méthode d'évaluation utilisant V-fold validation croisée pour estimer l'erreur de généralisation de l'arbre CART et déterminer le niveau d'élagage optimal.