Glosario IA
El diccionario completo de la Inteligencia Artificial
Regresión lineal
Modelo estadístico que establece una relación lineal entre una variable dependiente y una o más variables independientes minimizando la suma de los cuadrados de los residuos. Este modelo se considera una caja blanca porque los coeficientes pueden interpretarse directamente como el impacto de cada variable en la predicción.
K-vecinos más cercanos (KNN)
Algoritmo de aprendizaje supervisado que clasifica una nueva muestra basándose en la clase mayoritaria de sus k vecinos más cercanos en el espacio de características. Este modelo es completamente interpretable porque las predicciones pueden explicarse mostrando explícitamente los vecinos utilizados para la decisión.
Reglas de asociación
Método de descubrimiento de relaciones entre variables en grandes bases de datos, típicamente representado en forma SI-ENTONCES con medidas de soporte y confianza. Estas reglas son intrínsecamente interpretables porque expresan directamente relaciones lógicas comprensibles entre los atributos.
Modelo lineal generalizado (GLM)
Extensión de la regresión lineal que permite distribuciones de respuesta distintas de la normal y funciones de enlace no lineales, manteniendo una estructura aditiva. Los GLM siguen siendo interpretables porque los coeficientes pueden transformarse para revelar el efecto marginal de cada predictor.
Modelo aditivo generalizado (GAM)
Extensión de los GLM donde la predicción es una suma de funciones suaves de variables individuales en lugar de términos lineales. Los GAM ofrecen alta interpretabilidad porque permiten visualizar por separado el efecto de cada variable en la predicción mientras capturan relaciones no lineales.
Análisis discriminante lineal (LDA)
Método de clasificación que busca encontrar una combinación lineal de características que mejor separe dos o más clases maximizando la razón entre la varianza entre clases y la varianza intraclase. La interpretabilidad proviene de los vectores propios que indican las direcciones más discriminantes en el espacio de características.
Árboles CART
Algoritmo de construcción de árboles de decisión que utiliza el índice de Gini para clasificación y el error cuadrático medio para regresión, con divisiones binarias en cada nodo. La estructura binaria de los árboles CART facilita la interpretación de las rutas de decisión y las reglas extraídas.
Algoritmo ID3
Algoritmo histórico de construcción de árboles de decisión que utiliza la ganancia de información basada en la entropía para seleccionar los atributos de división. ID3 produce árboles altamente interpretables donde cada ruta representa una regla de decisión clara basada en pruebas binarias o multiclase.
Algoritmo C4.5
Mejora del algoritmo ID3 que utiliza la relación de ganancia de información para evitar el sesgo hacia atributos con muchos valores, y maneja atributos continuos y valores faltantes. C4.5 genera árboles de decisión optimizados mientras preserva una interpretabilidad completa del proceso de decisión.
Algoritmo CHAID
Algoritmo de construcción de árboles de decisión que utiliza pruebas de chi-cuadrado para variables categóricas y pruebas F para variables continuas, con divisiones multivía en lugar de binarias. CHAID produce árboles particularmente interpretables para datos de encuestas y marketing.
Lista de decisión
Estructura de clasificación representada como una secuencia ordenada de reglas SI-ENTONCES, donde cada regla se prueba secuencialmente hasta que una se satisface. Las listas de decisión ofrecen una interpretabilidad superior a los árboles porque presentan un flujo de decisión lineal en lugar de una estructura arbórea compleja.
Modelo basado en reglas
Sistema de clasificación o regresión que utiliza un conjunto de reglas lógicas para hacer predicciones, a menudo organizado en conjunto de cobertura o lista de decisión. Estos modelos están entre los más interpretables porque cada predicción puede explicarse mediante una o más reglas explícitas comprensibles para no expertos.
Perceptrón simple
Algoritmo de clasificación lineal binario que aprende un hiperplano separador ajustando iterativamente los pesos basados en errores de clasificación. Aunque simple, el perceptrón sigue siendo interpretable porque los pesos pueden examinarse para comprender la importancia y dirección de la influencia de cada característica.
Regresión de Poisson
Modelo de regresión para datos de conteo que asume que la variable de respuesta sigue una distribución de Poisson, con un enlace logarítmico para la función media. Los coeficientes exponenciales del modelo permiten una interpretación directa como multiplicadores de las tasas de eventos esperados.
Gradient Boosting Estocástico (SGB)
Método de conjunto que combina modelos interpretables simples (a menudo árboles poco profundos) construyendo secuencialmente cada nuevo modelo para corregir errores del anterior. Aunque potente, SGB con árboles poco profundos conserva cierta interpretabilidad a través de las contribuciones de cada árbol individual.