Glosario IA
El diccionario completo de la Inteligencia Artificial
Contaminación
Hiperparámetro del Isolation Forest que define la proporción esperada de anomalías en el conjunto de datos, utilizado para calibrar el umbral de decisión sobre los puntajes de anomalía.
iTree (Árbol de Aislamiento)
Árbol de decisión binario construido aleatoriamente en un Isolation Forest, donde cada partición se realiza sobre una característica y un valor de separación elegidos aleatoriamente hasta el aislamiento de cada punto.
Aislamiento
Principio según el cual las anomalías son puntos de datos 'poco numerosos y diferentes', y por lo tanto son más fáciles de aislar que los puntos normales, requiriendo menos particiones en un árbol.
Nivel de Extensión
Hiperparámetro opcional en algunas implementaciones de Isolation Forest que controla el número de dimensiones a dividir simultáneamente en cada nodo, permitiendo manejar datos de muy alta dimensionalidad.
Función de Puntuación
Función matemática que transforma la longitud de camino promedio en un puntaje de anomalía normalizado, generalmente basada en la distribución de la longitud de camino en un árbol aleatorio.
Tamaño del Bosque
Número de iTrees construidos en el Isolation Forest, un hiperparámetro que influye en la estabilidad y precisión de los puntajes de anomalía finales.
Profundidad del Nodo
Profundidad de un nodo específico en un iTree, utilizada para calcular la longitud del camino y por lo tanto el puntaje de aislamiento de un punto de datos.
Anomalías Externas
Tipo de anomalías que se sitúan fuera de las regiones de alta densidad de los datos, detectadas eficazmente por el Isolation Forest debido a su rápido aislamiento.
Complejidad Computacional
Medida de la eficiencia del Isolation Forest, que es lineal con respecto al número de observaciones y sublineal con respecto al número de características, haciéndola adecuada para grandes conjuntos de datos.