Glosario IA
El diccionario completo de la Inteligencia Artificial
Bosque Aleatorio Equilibrado
Variante del Random Forest diseñada para manejar conjuntos de datos desequilibrados creando árboles de decisión sobre submuestras bootstrap donde cada clase está representada de manera equitativa.
Bootstrap Equilibrado
Técnica de muestreo donde, para cada iteración, se extrae una muestra bootstrap garantizando una representación igual de las clases, generalmente submuestreando la clase mayoritaria o sobremuestreando la clase minoritaria.
Submuestreo de la Clase Mayoritaria
Método para reducir el desequilibrio de clases que consiste en eliminar aleatoriamente observaciones de la clase mayoritaria para disminuir su predominancia en el conjunto de datos de entrenamiento.
Sobremuestreo de la Clase Minoritaria
Técnica para aumentar el número de observaciones de la clase minoritaria, ya sea por duplicación o generando nuevas observaciones sintéticas, para equilibrar la distribución de clases.
Muestra Bootstrap
Muestra aleatoria extraída con reemplazo del conjunto de datos original, utilizada en métodos de bagging para entrenar cada modelo del ensemble sobre un subconjunto ligeramente diferente de los datos.
Puntaje de Gini
Medida de la impureza de un nodo en un árbol de decisión, que cuantifica la probabilidad de que una observación elegida aleatoriamente en el nodo sea mal clasificada si se etiquetara aleatoriamente según la distribución de clases.
AUC-ROC (Área Bajo la Curva Característica de Operación del Receptor)
Métrica de rendimiento que mide la capacidad de un clasificador para distinguir entre clases, representando el área bajo la curva que traza la tasa de verdaderos positivos en función de la tasa de falsos positivos.
EasyEnsemble
Algoritmo de aprendizaje ensemble que crea múltiples subconjuntos de la clase mayoritaria, entrena un clasificador en cada subconjunto combinado con la totalidad de la clase minoritaria, y agrega las predicciones.
BalanceCascade
Método de conjunto iterativo que entrena secuencialmente clasificadores en conjuntos de datos cada vez más equilibrados, eliminando correctamente los ejemplos de la clase mayoritaria que están bien clasificados en cada etapa.
Recall (Sensibilidad)
Métrica que mide la proporción de observaciones positivas reales que han sido correctamente identificadas por el modelo, esencial para evaluar el rendimiento en la clase minoritaria.