AI 詞彙表
人工智能完整詞典
CART(分类与回归树)
一种构建决策树的基础算法,分类时使用基尼指数,回归时使用方差。
ID3 (迭代二分器3)
第一个使用信息增益作为节点划分标准的决策树算法。
C4.5 et C5.0
Évolution de ID3 gérant les attributs continus et utilisant le ratio de gain pour éviter le biais vers les attributs à nombreuses valeurs.
Bagging (Bootstrap Aggregating)
Technique d'ensemble créant multiple modèles sur des sous-échantillons bootstrap, fondation des Random Forests.
Feature Importance
Méthode d'évaluation de l'importance des variables basée sur la réduction d'impureté ou la permutation dans les Random Forests.
Out-of-Bag Error
Estimation d'erreur sans validation croisée utilisant les échantillons non sélectionnés dans le bootstrap de chaque arbre.
Tree Pruning (Élagage)
Techniques de réduction de la complexité des arbres pour éviter le surapprentissage (pre-pruning et post-pruning).
Gini Impurity
Mesure de l'impureté d'un nœud calculant la probabilité de mauvaise classification d'un élément choisi aléatoirement.
Information Gain et Entropie
Critères de division basés sur la théorie de l'information mesurant la réduction d'entropie après une partition.
Extra-Trees (Extremely Randomized Trees)
Variante des Random Forests avec sélection aléatoire des seuils de division pour réduire encore plus la variance.
Isolation Forest
Application des Random Forests pour la détection d'anomalies en isolant les observations dans des arbres courts.
Gradient Boosted Trees
Méthode d'ensemble séquentielle construisant des arbres pour corriger les erreurs résiduelles des modèles précédents.