Bosque Aleatorio Equilibrado

📖

términos

Bosque Aleatorio Equilibrado

Variante del Random Forest diseñada para manejar conjuntos de datos desequilibrados creando árboles de decisión sobre submuestras bootstrap donde cada clase está representada de manera equitativa.

📖

términos

Técnica de muestreo donde, para cada iteración, se extrae una muestra bootstrap garantizando una representación igual de las clases, generalmente submuestreando la clase mayoritaria o sobremuestreando la clase minoritaria.

📖

términos

Submuestreo de la Clase Mayoritaria

Método para reducir el desequilibrio de clases que consiste en eliminar aleatoriamente observaciones de la clase mayoritaria para disminuir su predominancia en el conjunto de datos de entrenamiento.

📖

términos

Sobremuestreo de la Clase Minoritaria

Técnica para aumentar el número de observaciones de la clase minoritaria, ya sea por duplicación o generando nuevas observaciones sintéticas, para equilibrar la distribución de clases.

📖

términos

Muestra Bootstrap

Muestra aleatoria extraída con reemplazo del conjunto de datos original, utilizada en métodos de bagging para entrenar cada modelo del ensemble sobre un subconjunto ligeramente diferente de los datos.

📖

términos

Puntaje de Gini

Medida de la impureza de un nodo en un árbol de decisión, que cuantifica la probabilidad de que una observación elegida aleatoriamente en el nodo sea mal clasificada si se etiquetara aleatoriamente según la distribución de clases.

📖

términos

AUC-ROC (Área Bajo la Curva Característica de Operación del Receptor)

Métrica de rendimiento que mide la capacidad de un clasificador para distinguir entre clases, representando el área bajo la curva que traza la tasa de verdaderos positivos en función de la tasa de falsos positivos.

📖

términos

EasyEnsemble

Algoritmo de aprendizaje ensemble que crea múltiples subconjuntos de la clase mayoritaria, entrena un clasificador en cada subconjunto combinado con la totalidad de la clase minoritaria, y agrega las predicciones.

📖

términos

BalanceCascade

Método de conjunto iterativo que entrena secuencialmente clasificadores en conjuntos de datos cada vez más equilibrados, eliminando correctamente los ejemplos de la clase mayoritaria que están bien clasificados en cada etapa.

📖

términos

Recall (Sensibilidad)

Métrica que mide la proporción de observaciones positivas reales que han sido correctamente identificadas por el modelo, esencial para evaluar el rendimiento en la clase minoritaria.

Glosario IA