Глоссарий ИИ
Полный словарь искусственного интеллекта
Arbre de décision aléatoire
Structure arborescente générée aléatoirement où chaque nœud divise l'espace des caractéristiques selon une coupure aléatoire, créant des partitions qui isolent progressivement les observations.
Score d'anomalie
Métrique quantitative calculée à partir de la longueur du chemin dans l'arbre, indiquant le degré d'anormalité d'une observation où un score élevé correspond à une forte probabilité d'être une anomalie.
Chemin d'isolation
Nombre de divisions nécessaires depuis la racine jusqu'à la feuille contenant une observation, où les anomalies présentent des chemins significativement plus courts que les points normaux.
Facteur de contamination
Paramètre crucial estimant la proportion attendue d'anomalies dans le jeu de données, généralement compris entre 0.01 et 0.1, influençant le seuil de classification.
Longueur moyenne du chemin
Valeur théorique attendue du chemin d'isolation pour des données non structurées, utilisée comme référence pour normaliser les scores d'anomalie dans le calcul final.
Division aléatoire de caractéristiques
Sélection aléatoire d'une caractéristique et d'une valeur de séparation à chaque nœud, évitant les biais liés aux distributions de caractéristiques et favorisant l'isolation des anomalies.
Score de normalité
Transformation du score d'anomalie sur une échelle normalisée, souvent entre 0 et 1, facilitant l'interprétation et la comparaison entre différents modèles ou ensembles de données.
Anomalie ponctuelle
Observation individuelle qui s'écarte significativement du comportement attendu des données, facilement identifiable par sa courte longueur de chemin d'isolation dans l'algorithme.
Рекурсивное разбиение
Итерационный процесс разделения пространства данных на всё более мелкие подобласти, создающий иерархическую структуру, которая эффективно изолирует аномальные наблюдения.
Порог обнаружения
Предельное значение, определяемое фактором загрязнения, которое отделяет нормальные наблюдения от аномалий и вычисляется на основе распределения оценок аномальности по всему набору данных.
Ограничивающий прямоугольник
Многомерный гипер-прямоугольник, создаваемый при каждом разделении дерева, определяющий границы разбиения и позволяющий эффективно вычислять пути изоляции.
Фактор локальных выбросов
Альтернативная метрика обнаружения аномалий, основанная на локальной плотности, часто сравниваемая с Isolation Forest для оценки производительности на различных типах распределений данных.
Обрезка дерева
Техника ограничения роста деревьев путём прекращения разделения, когда узлы содержат один образец или достигают максимальной глубины, что оптимизирует время вычислений.