Modelos de Caja Blanca

📖

términos

Regresión lineal

Modelo estadístico que establece una relación lineal entre una variable dependiente y una o más variables independientes minimizando la suma de los cuadrados de los residuos. Este modelo se considera una caja blanca porque los coeficientes pueden interpretarse directamente como el impacto de cada variable en la predicción.

📖

términos

K-vecinos más cercanos (KNN)

Algoritmo de aprendizaje supervisado que clasifica una nueva muestra basándose en la clase mayoritaria de sus k vecinos más cercanos en el espacio de características. Este modelo es completamente interpretable porque las predicciones pueden explicarse mostrando explícitamente los vecinos utilizados para la decisión.

📖

términos

Reglas de asociación

Método de descubrimiento de relaciones entre variables en grandes bases de datos, típicamente representado en forma SI-ENTONCES con medidas de soporte y confianza. Estas reglas son intrínsecamente interpretables porque expresan directamente relaciones lógicas comprensibles entre los atributos.

📖

términos

Modelo lineal generalizado (GLM)

Extensión de la regresión lineal que permite distribuciones de respuesta distintas de la normal y funciones de enlace no lineales, manteniendo una estructura aditiva. Los GLM siguen siendo interpretables porque los coeficientes pueden transformarse para revelar el efecto marginal de cada predictor.

📖

términos

Modelo aditivo generalizado (GAM)

Extensión de los GLM donde la predicción es una suma de funciones suaves de variables individuales en lugar de términos lineales. Los GAM ofrecen alta interpretabilidad porque permiten visualizar por separado el efecto de cada variable en la predicción mientras capturan relaciones no lineales.

📖

términos

Análisis discriminante lineal (LDA)

Método de clasificación que busca encontrar una combinación lineal de características que mejor separe dos o más clases maximizando la razón entre la varianza entre clases y la varianza intraclase. La interpretabilidad proviene de los vectores propios que indican las direcciones más discriminantes en el espacio de características.

📖

términos

Árboles CART

Algoritmo de construcción de árboles de decisión que utiliza el índice de Gini para clasificación y el error cuadrático medio para regresión, con divisiones binarias en cada nodo. La estructura binaria de los árboles CART facilita la interpretación de las rutas de decisión y las reglas extraídas.

📖

términos

Algoritmo ID3

Algoritmo histórico de construcción de árboles de decisión que utiliza la ganancia de información basada en la entropía para seleccionar los atributos de división. ID3 produce árboles altamente interpretables donde cada ruta representa una regla de decisión clara basada en pruebas binarias o multiclase.

📖

términos

Algoritmo C4.5

Mejora del algoritmo ID3 que utiliza la relación de ganancia de información para evitar el sesgo hacia atributos con muchos valores, y maneja atributos continuos y valores faltantes. C4.5 genera árboles de decisión optimizados mientras preserva una interpretabilidad completa del proceso de decisión.

📖

términos

Algoritmo CHAID

Algoritmo de construcción de árboles de decisión que utiliza pruebas de chi-cuadrado para variables categóricas y pruebas F para variables continuas, con divisiones multivía en lugar de binarias. CHAID produce árboles particularmente interpretables para datos de encuestas y marketing.

📖

términos

Lista de decisión

Estructura de clasificación representada como una secuencia ordenada de reglas SI-ENTONCES, donde cada regla se prueba secuencialmente hasta que una se satisface. Las listas de decisión ofrecen una interpretabilidad superior a los árboles porque presentan un flujo de decisión lineal en lugar de una estructura arbórea compleja.

📖

términos

Modelo basado en reglas

Sistema de clasificación o regresión que utiliza un conjunto de reglas lógicas para hacer predicciones, a menudo organizado en conjunto de cobertura o lista de decisión. Estos modelos están entre los más interpretables porque cada predicción puede explicarse mediante una o más reglas explícitas comprensibles para no expertos.

📖

términos

Perceptrón simple

Algoritmo de clasificación lineal binario que aprende un hiperplano separador ajustando iterativamente los pesos basados en errores de clasificación. Aunque simple, el perceptrón sigue siendo interpretable porque los pesos pueden examinarse para comprender la importancia y dirección de la influencia de cada característica.

📖

términos

Regresión de Poisson

Modelo de regresión para datos de conteo que asume que la variable de respuesta sigue una distribución de Poisson, con un enlace logarítmico para la función media. Los coeficientes exponenciales del modelo permiten una interpretación directa como multiplicadores de las tasas de eventos esperados.

📖

términos

Gradient Boosting Estocástico (SGB)

Método de conjunto que combina modelos interpretables simples (a menudo árboles poco profundos) construyendo secuencialmente cada nuevo modelo para corregir errores del anterior. Aunque potente, SGB con árboles poco profundos conserva cierta interpretabilidad a través de las contribuciones de cada árbol individual.

Glosario IA

Regresión lineal

K-vecinos más cercanos (KNN)

Reglas de asociación

Modelo lineal generalizado (GLM)

Modelo aditivo generalizado (GAM)

Análisis discriminante lineal (LDA)

Árboles CART

Algoritmo ID3

Algoritmo C4.5

Algoritmo CHAID

Lista de decisión

Modelo basado en reglas

Perceptrón simple

Regresión de Poisson

Gradient Boosting Estocástico (SGB)

No se encontraron resultados