Glossaire IA
Le dictionnaire complet de l'Intelligence Artificielle
Arbre de décision aléatoire
Structure arborescente générée aléatoirement où chaque nœud divise l'espace des caractéristiques selon une coupure aléatoire, créant des partitions qui isolent progressivement les observations.
Score d'anomalie
Métrique quantitative calculée à partir de la longueur du chemin dans l'arbre, indiquant le degré d'anormalité d'une observation où un score élevé correspond à une forte probabilité d'être une anomalie.
Chemin d'isolation
Nombre de divisions nécessaires depuis la racine jusqu'à la feuille contenant une observation, où les anomalies présentent des chemins significativement plus courts que les points normaux.
Facteur de contamination
Paramètre crucial estimant la proportion attendue d'anomalies dans le jeu de données, généralement compris entre 0.01 et 0.1, influençant le seuil de classification.
Longueur moyenne du chemin
Valeur théorique attendue du chemin d'isolation pour des données non structurées, utilisée comme référence pour normaliser les scores d'anomalie dans le calcul final.
Division aléatoire de caractéristiques
Sélection aléatoire d'une caractéristique et d'une valeur de séparation à chaque nœud, évitant les biais liés aux distributions de caractéristiques et favorisant l'isolation des anomalies.
Score de normalité
Transformation du score d'anomalie sur une échelle normalisée, souvent entre 0 et 1, facilitant l'interprétation et la comparaison entre différents modèles ou ensembles de données.
Anomalie ponctuelle
Observation individuelle qui s'écarte significativement du comportement attendu des données, facilement identifiable par sa courte longueur de chemin d'isolation dans l'algorithme.
Partitionnement récursif
Processus itératif de division de l'espace des données en sous-régions de plus en plus petites, créant une structure hiérarchique qui isole efficacement les observations aberrantes.
Seuil de détection
Valeur limite déterminée par le facteur de contamination séparant les observations normales des anomalies, calculée à partir de la distribution des scores d'anomalie sur l'ensemble de données.
Boîte englobante
Hyper-rectangle multidimensionnel créé à chaque division de l'arbre, définissant les limites de la partition et permettant de calculer efficacement les chemins d'isolation.
Facteur de localisation aberrante
Métrique alternative de détection d'anomalie basée sur la densité locale, souvent comparée à l'Isolation Forest pour évaluer les performances sur différents types de distributions de données.
Élagage d'arbre
Technique de limitation de la croissance des arbres en arrêtant la division lorsque les nœuds contiennent un seul échantillon ou atteignent la profondeur maximale, optimisant les temps de calcul.