Glosario IA
El diccionario completo de la Inteligencia Artificial
Árbol de aislamiento
Estructura jerárquica binaria utilizada en el Isolation Forest para particionar aleatoriamente el espacio de datos hasta el aislamiento completo de cada observación.
Profundidad de partición
Número de divisiones necesarias para aislar una observación particular desde la raíz hasta la hoja en un árbol de aislamiento.
Longitud del camino
Longitud del camino recorrido por una observación a través de un árbol de aislamiento, medida como el número de aristas cruzadas desde la raíz hasta la hoja.
Submuestreo
Técnica de muestreo aleatorio utilizada en el Isolation Forest para seleccionar un subconjunto de datos durante la construcción de cada árbol, reduciendo el sesgo y mejorando la eficiencia.
Tasa de contaminación
Parámetro del Isolation Forest que define la proporción esperada de anomalías en el conjunto de datos, utilizado para determinar el umbral de clasificación.
Clasificación de una sola clase
Problema de aprendizaje supervisado donde el objetivo es detectar las observaciones que no pertenecen a la clase mayoritaria, típicamente utilizado para la detección de anomalías.
Partición aleatoria
Estrategia de división de nodos en el Isolation Forest donde una característica y un valor de separación se eligen aleatoriamente, a diferencia de los criterios optimizados de los árboles de decisión clásicos.
Eficiencia de aislamiento
Capacidad del algoritmo para aislar rápidamente las anomalías con caminos cortos en comparación con las observaciones normales que requieren particiones más profundas.
Longitud Promedio del Camino
Promedio de las longitudes de camino de una observación a través de todos los árboles del bosque, normalizado para proporcionar una medida comparable entre diferentes conjuntos de datos.
Construcción del Bosque
Proceso de creación de la colección de árboles de aislamiento entrenando cada árbol en un subconjunto aleatorio diferente de los datos de entrenamiento.
Puntuación de Aislamiento
Valor normalizado entre 0 y 1 calculado a partir de la profundidad media de aislamiento, donde valores más altos indican una mayor probabilidad de ser una anomalía.
Particionamiento del Espacio de Características
División recursiva del espacio multidimensional de características en regiones hiperrectangulares para aislar individualmente cada observación.
Detección de Anomalías Basada en Árboles
Enfoque de detección de anomalías utilizando estructuras arbóreas para modelar la distribución de datos e identificar observaciones desviadas.
Aislamiento de Nodos Hoja
Condición terminal en un árbol de aislamiento donde una observación está sola en un nodo hoja, marcando el final del proceso de aislamiento.
Detección de Anomalías No Supervisada
Paradigma de aprendizaje donde el algoritmo identifica anomalías sin necesidad de etiquetas, basándose únicamente en la estructura inherente de los datos.
Método de Ensemble
Técnica de aprendizaje automático que combina múltiples modelos (árboles) para mejorar la robustez y generalización de las predicciones de detección de anomalías.
Umbral de Anomalía
Valor límite del puntaje de anomalía que separa las observaciones normales de las anomalías, generalmente determinado según la tasa de contaminación especificada.