Glosario IA
El diccionario completo de la Inteligencia Artificial
Longitud de ruta
Número de divisiones necesarias para aislar un punto de datos específico desde la raíz hasta la hoja en un árbol de aislamiento. Las longitudes de ruta más cortas indican observaciones potencialmente anómalas.
Construcción de bosque
Proceso de creación de múltiples árboles de aislamiento independientes utilizando diferentes submuestras aleatorias de los datos de entrenamiento. El rendimiento aumenta con el número de árboles hasta un cierto umbral.
Longitud de ruta promedio
Promedio de las longitudes de ruta de un punto de datos a través de todos los árboles del bosque de aislamiento. Sirve de base para calcular la puntuación final de anomalía de la observación.
Función de puntuación de anomalía
Fórmula matemática que transforma la longitud de ruta promedio en una puntuación normalizada, teniendo en cuenta el tamaño de la muestra y la estructura teórica del árbol. Produce una interpretación probabilística de la anomalía.
iTree
Abreviatura de Isolation Tree, que designa un árbol individual en un bosque de aislamiento. Cada iTree se construye sobre una submuestra aleatoria y utiliza divisiones aleatorias para aislar las observaciones.
Tamaño de submuestreo
Número de observaciones utilizadas para construir cada árbol individual en el bosque, típicamente fijado en 256 por razones de rendimiento estadístico. Afecta el equilibrio entre la eficiencia computacional y la calidad de la detección.
Detección de valores atípicos
Proceso de identificación de observaciones que se desvían significativamente del comportamiento normal esperado en un conjunto de datos. El Isolation Forest sobresale en esta tarea gracias a su enfoque de aislamiento basado en la estructura.
Detección de anomalías no supervisada
Enfoque de aprendizaje automático que identifica anomalías sin necesidad de etiquetas de entrenamiento, basándose únicamente en la distribución intrínseca de los datos. El Isolation Forest es un ejemplo paradigmático de este método.
Altura del árbol
Longitud máxima del camino desde la raíz hasta cualquier hoja en un árbol de aislamiento. Las anomalías tienden a ser aisladas en hojas más cercanas a la raíz con alturas de árbol más pequeñas.
Particionamiento aleatorio
Estrategia de construcción de árboles que utiliza divisiones aleatorias sin optimización específica, a diferencia de los árboles de decisión clásicos. Esta simplicidad hace que el algoritmo sea eficiente para aislar anomalías rápidamente.