AI 용어집
인공지능 완전 사전
Longueur de chemin
Nombre de divisions nécessaires pour isoler un point de données spécifique de la racine à la feuille dans un arbre d'isolation. Les longueurs de chemin plus courtes indiquent des observations potentiellement anormales.
Construction de forêt
Processus de création de multiples arbres d'isolation indépendants en utilisant différents sous-échantillons aléatoires des données d'entraînement. La performance augmente avec le nombre d'arbres jusqu'à un certain seuil.
Longueur de chemin moyenne
Moyenne des longueurs de chemin d'un point de données à travers tous les arbres de la forêt d'isolation. Sert de base pour calculer le score final d'anomalie de l'observation.
Fonction de score d'anomalie
Formule mathématique transformant la longueur de chemin moyenne en score normalisé, prenant en compte la taille de l'échantillon et la structure théorique de l'arbre. Produit une interprétation probabiliste de l'anomalie.
iTree
Abréviation pour Isolation Tree, désignant un arbre individuel dans une forêt d'isolation. Chaque iTree est construit sur un sous-échantillon aléatoire et utilise des divisions aléatoires pour isoler les observations.
Taille de sous-échantillonnage
Nombre d'observations utilisées pour construire chaque arbre individuel dans la forêt, typiquement fixé à 256 pour des raisons de performance statistique. Affecte l'équilibre entre efficacité computationnelle et qualité de détection.
Détection de valeurs aberrantes
Processus d'identification d'observations qui s'écartent significativement du comportement normal attendu dans un jeu de données. L'Isolation Forest excelle dans cette tâche grâce à son approche d'isolation basée sur la structure.
Détection d'anomalies non supervisée
Approche d'apprentissage automatique identifiant les anomalies sans nécessiter d'étiquettes d'entraînement, en se basant uniquement sur la distribution intrinsèque des données. L'Isolation Forest est un exemple paradigmatique de cette méthode.
Hauteur d'arbre
Longueur maximale du chemin de la racine à n'importe quelle feuille dans un arbre d'isolation. Les anomalies ont tendance à être isolées dans des feuilles plus proches de la racine avec des hauteurs d'arbre plus petites.
Partitionnement aléatoire
Stratégie de construction d'arbres utilisant des divisions aléatoires sans optimisation spécifique, contrairement aux arbres de décision classiques. Cette simplicité rend l'algorithme efficace pour isoler les anomalies rapidement.