Glosario IA
El diccionario completo de la Inteligencia Artificial
CART (Árboles de Clasificación y Regresión)
Algoritmo fundamental para construir árboles de decisión utilizando el índice de Gini para la clasificación y la varianza para la regresión.
ID3 (Iterative Dichotomiser 3)
Primer algoritmo de árbol de decisión que utiliza la ganancia de información como criterio de división de nodos.
C4.5 y C5.0
Evolución de ID3 que gestiona atributos continuos y utiliza la razón de ganancia para evitar el sesgo hacia atributos con muchos valores.
Bagging (Agregación Bootstrap)
Técnica de conjunto que crea múltiples modelos sobre submuestras bootstrap, base de los Random Forests.
Importancia de las características
Método de evaluación de la importancia de las variables basada en la reducción de impureza o la permutación en los Random Forests.
Error Out-of-Bag
Estimación de error sin validación cruzada utilizando las muestras no seleccionadas en el bootstrap de cada árbol.
Poda de árboles (Élagage)
Técnicas de reducción de la complejidad de los árboles para evitar el sobreaprendizaje (pre-poda y post-poda).
Impureza de Gini
Medida de la impureza de un nodo calculando la probabilidad de mala clasificación de un elemento elegido aleatoriamente.
Ganancia de Información y Entropía
Criterios de división basados en la teoría de la información que miden la reducción de entropía después de una partición.
Extra-Trees (Árboles Extremadamente Aleatorios)
Variante de los Random Forests con selección aleatoria de los umbrales de división para reducir aún más la varianza.
Isolation Forest
Aplicación de Random Forests para la detección de anomalías aislando las observaciones en árboles cortos.
Árboles de Potenciación de Gradiente
Método de conjunto secuencial que construye árboles para corregir los errores residuales de los modelos anteriores.