Glossario IA
Il dizionario completo dell'Intelligenza Artificiale
Arbre d'isolation
Structure hiérarchique binaire utilisée dans l'Isolation Forest pour partitionner aléatoirement l'espace des données jusqu'à l'isolement complet de chaque observation.
Profondeur de partition
Nombre de divisions nécessaires pour isoler une observation particulière depuis la racine jusqu'à la feuille dans un arbre d'isolation.
Path Length
Longueur du chemin parcouru par une observation à travers un arbre d'isolation, mesurée comme le nombre d'arêtes traversées de la racine à la feuille.
Sub-sampling
Technique d'échantillonnage aléatoire utilisée dans l'Isolation Forest pour sélectionner un sous-ensemble de données lors de la construction de chaque arbre, réduisant le biais et améliorant l'efficacité.
Contamination Rate
Paramètre de l'Isolation Forest définissant la proportion attendue d'anomalies dans le jeu de données, utilisé pour déterminer le seuil de classification.
One-Class Classification
Problème d'apprentissage supervisé où l'objectif est de détecter les observations n'appartenant pas à la classe majoritaire, typiquement utilisé pour la détection d'anomalies.
Random Partitioning
Stratégie de division des nœuds dans l'Isolation Forest où une caractéristique et une valeur de séparation sont choisies aléatoirement, contrairement aux critères optimisés des arbres de décision classiques.
Isolation Efficiency
Capacité de l'algorithme à isoler rapidement les anomalies avec des chemins courts par rapport aux observations normales qui nécessitent des partitions plus profondes.
Average Path Length
Moyenne des longueurs de chemin d'une observation à travers tous les arbres de la forêt, normalisée pour fournir une mesure comparable entre différents jeux de données.
Forest Construction
Processus de création de la collection d'arbres d'isolation en entraînant chaque arbre sur un sous-ensemble aléatoire différent des données d'entraînement.
Isolation Score
Valeur normalisée entre 0 et 1 calculée à partir de la profondeur moyenne d'isolation, où des valeurs plus élevées indiquent une plus grande probabilité d'être une anomalie.
Feature Space Partitioning
Division récursive de l'espace multidimensionnel des caractéristiques en régions hyperrectangulaires pour isoler individuellement chaque observation.
Tree-Based Anomaly Detection
Approche de détection d'anomalies utilisant des structures arborescentes pour modéller la distribution des données et identifier les observations déviantes.
Leaf Node Isolation
Condition terminale dans un arbre d'isolation où une observation est seule dans un nœud feuille, marquant la fin du processus d'isolation.
Unsupervised Anomaly Detection
Paradigme d'apprentissage où l'algorithme identifie les anomalies sans nécessiter d'étiquettes, en se basant uniquement sur la structure inhérente des données.
Ensemble Method
Technique d'apprentissage automatique combinant plusieurs modèles (arbres) pour améliorer la robustesse et la généralisation des prédictions de détection d'anomalies.
Anomaly Threshold
Valeur limite du score d'anomalie séparant les observations normales des anomalies, généralement déterminée selon le taux de contamination spécifié.