Glosario IA
El diccionario completo de la Inteligencia Artificial
Learning Rate (Tasa de aprendizaje)
Hiperparámetro que controla la contribución de cada estimador al modelo final, permitiendo un equilibrio entre la velocidad de convergencia y la precisión del modelo.
Max Depth (Profundidad máxima)
Hiperparámetro que define la profundidad máxima de cada árbol de decisión, controlando la complejidad del modelo y el riesgo de sobreajuste.
Split Finding
Proceso algorítmico para encontrar el mejor punto de división en un nodo de árbol, optimizado en XGBoost a través de una estructura de datos llamada histograma.
Tree Pruning (Poda de árbol)
Técnica de post-poda basada en la puntuación de ganancia, que elimina las ramas del árbol que no aportan una ganancia de pérdida positiva para simplificar el modelo.
Early Stopping (Parada temprana)
Técnica de regularización que detiene el entrenamiento cuando el rendimiento en un conjunto de validación deja de mejorar, evitando el sobreajuste.
Gamma (min_split_loss)
Hiperparámetro de regularización que especifica la pérdida mínima requerida para realizar una nueva división en un nodo de árbol, controlando la complejidad.
Lambda (regularización L2 en pesos)
Hiperparámetro de regularización L2 aplicado a los pesos de las hojas de los árboles, reduciendo su amplitud para prevenir el sobreajuste.
Alpha (regularización L1 en pesos)
Hiperparámetro de regularización L1 aplicado a los pesos de las hojas de los árboles, favoreciendo la dispersión y pudiendo establecer algunos pesos en cero.
Scale-Pos-Weight
Hiperparámetro utilizado para problemas de clasificación desequilibrados, ponderando la clase positiva con respecto a la clase negativa.
Paralelización
Capacidad de XGBoost para paralelizar la construcción de árboles en múltiples núcleos CPU, acelerando significativamente el tiempo de entrenamiento.
Acceso Consciente de Caché
Optimización algorítmica en XGBoost que organiza los accesos a memoria para maximizar el uso de la caché del procesador, mejorando el rendimiento.