Glosario IA
El diccionario completo de la Inteligencia Artificial
Árbol de decisión aleatorio
Estructura arbórea generada aleatoriamente donde cada nodo divide el espacio de características según un corte aleatorio, creando particiones que aislan progresivamente las observaciones.
Puntuación de anomalía
Métrica cuantitativa calculada a partir de la longitud del camino en el árbol, indicando el grado de anormalidad de una observación donde una puntuación alta corresponde a una alta probabilidad de ser una anomalía.
Camino de aislamiento
Número de divisiones necesarias desde la raíz hasta la hoja que contiene una observación, donde las anomalías presentan caminos significativamente más cortos que los puntos normales.
Factor de contaminación
Parámetro crucial que estima la proporción esperada de anomalías en el conjunto de datos, generalmente entre 0.01 y 0.1, influyendo en el umbral de clasificación.
Longitud media del camino
Valor teórico esperado del camino de aislamiento para datos no estructurados, utilizado como referencia para normalizar las puntuaciones de anomalía en el cálculo final.
División aleatoria de características
Selección aleatoria de una característica y un valor de separación en cada nodo, evitando sesgos relacionados con las distribuciones de características y favoreciendo el aislamiento de anomalías.
Puntuación de normalidad
Transformación de la puntuación de anomalía en una escala normalizada, a menudo entre 0 y 1, facilitando la interpretación y comparación entre diferentes modelos o conjuntos de datos.
Anomalía puntual
Observación individual que se desvía significativamente del comportamiento esperado de los datos, fácilmente identificable por su corta longitud de camino de aislamiento en el algoritmo.
Particionamiento recursivo
Proceso iterativo de división del espacio de datos en subregiones cada vez más pequeñas, creando una estructura jerárquica que aísla eficientemente las observaciones aberrantes.
Umbral de detección
Valor límite determinado por el factor de contaminación que separa las observaciones normales de las anomalías, calculada a partir de la distribución de los puntajes de anomalía en el conjunto de datos.
Caja delimitadora
Hiperrectángulo multidimensional creado en cada división del árbol, definiendo los límites de la partición y permitiendo calcular eficientemente las rutas de aislamiento.
Factor de anomalía local
Métrica alternativa de detección de anomalías basada en la densidad local, a menudo comparada con el Isolation Forest para evaluar el rendimiento en diferentes tipos de distribuciones de datos.
Poda de árbol
Técnica de limitación del crecimiento de los árboles deteniendo la división cuando los nodos contienen una sola muestra o alcanzan la profundidad máxima, optimizando los tiempos de cálculo.