Glosario IA
El diccionario completo de la Inteligencia Artificial
Importancia de la característica
Métrica cuantificando la influencia de cada variable predictiva en el rendimiento de un modelo Random Forest, calculada ya sea por reducción media de impureza o por permutación aleatoria.
Importancia de Gini
Método de evaluación de la importancia de variables basado en la disminución total de la impureza de Gini acumulada en todos los nodos donde la variable se usa para dividir.
Reducción media de impureza
Técnica que mide la importancia de una variable por la reducción media de impureza (Gini o entropía) que aporta cuando se usa como criterio de división en los árboles.
Importancia por permutación
Método independiente del modelo que evalúa la importancia de una variable midiendo la degradación del rendimiento del modelo cuando los valores de esta variable se permutan aleatoriamente.
Reducción media de precisión
Indicador de la importancia de una variable basado en la disminución media de la precisión del modelo cuando esta variable se permuta en los datos out-of-bag.
Medida de impureza
Función matemática que cuantifica el grado de heterogeneidad de las clases en un nodo, utilizada para optimizar las divisiones en los árboles de decisión.
Ganancia de información
Criterio de división que mide la reducción de entropía obtenida al particionar un nodo según una característica específica, favoreciendo las divisiones que maximizan la homogeneidad resultante.
Índice de Gini
Medida de impureza que calcula la probabilidad de que una observación clasificada aleatoriamente sea incorrecta, evaluando la heterogeneidad de las clases en un nodo de árbol de decisión.
Error Out-of-Bag
Estimación de error no sesgada calculada evaluando cada árbol en las observaciones no utilizadas durante su entrenamiento, sirviendo como validación cruzada interna en Random Forest.
Selección de Características
Proceso de identificación y conservación de las variables más relevantes basado en sus puntuaciones de importancia, eliminando las características redundantes o no informativas.
Gráfico de Importancia de Variables
Visualización que ordena las variables predictivas según su puntuación de importancia decreciente, facilitando la interpretación de los factores más influyentes del modelo.
Gráfico de Dependencia Parcial
Representación gráfica que muestra el efecto marginal de una o dos variables sobre la predicción del modelo, promediando sobre todas las demás variables.
Impureza del Nodo
Grado de heterogeneidad de las observaciones en un nodo de árbol, sirviendo como base para el cálculo de la importancia de las características a través de su contribución a la reducción de esta impureza.
Criterio de División
Regla que determina la división óptima de un nodo en función de una característica y un umbral, impactando directamente la distribución de la importancia entre las variables.