Słownik AI
Kompletny słownik sztucznej inteligencji
Encodage Target-wise
Technique d'encodage des variables catégorielles utilisant les statistiques de la variable cible pour créer des représentations numériques informatives.
Boosting Ordonné
Stratégie d'entraînement séquentiel où les observations sont ordonnées temporellement pour éviter le data leakage dans l'encodage des variables catégorielles.
Symmetric Trees
Structure d'arbres de décision où chaque niveau utilise la même condition de division pour tous les nœuds, optimisant les prédictions et réduisant le surapprentissage.
Ordered Target Encoding
Méthode d'encodage qui calcule les statistiques de la variable cible uniquement sur les observations précédentes dans l'ordre d'entraînement.
CatBoost Encoder
Encodeur intégré qui transforme automatiquement les variables catégorielles en features numériques en utilisant des statistiques de la cible avec régularisation.
Overfitting Detector
Mécanisme intégré qui surveille les performances sur un jeu de validation et arrête l'entraînement lorsque le surapprentissage est détecté.
Border Count
Paramètre contrôlant le nombre de points de分割 utilisés pour discrétiser les variables numériques en features catégorielles binaires.
Categorical Features Declaration
Processus de spécification des colonnes catégorielles dans le dataset, permettant à CatBoost d'appliquer automatiquement les traitements appropriés.
Model Shrinkage
Méthode de régularisation qui réduit l'impact des arbres individuels en appliquant un facteur de pondération pour prévenir le surapprentissage.
Prediction Type Change
Capacité de CatBoost à modifier dynamiquement le type de prédiction (probabilités ou classes) pendant l'entraînement pour optimiser les métriques.
Feature Combinations
Génération automatique de nouvelles features par combinaison de variables catégorielles, améliorant la capacité du modèle à capturer les interactions.
Monotonic Constraints
Restrictions imposées sur les features pour garantir que les prédictions du modèle respectent des relations monotones avec certaines variables.
CatBoost Pool
Structure de données optimisée contenant les features, labels, et métadonnées spécifiques pour un entraînement efficace avec CatBoost.