Glosario IA
El diccionario completo de la Inteligencia Artificial
Regresión LASSO
Método de regularización L1 que penaliza los coeficientes absolutos de las características, forzando algunos coeficientes a cero para realizar una selección automática de variables.
Información Mutua
Medida estadística que cuantifica la dependencia entre dos variables, utilizada para evaluar la relevancia de las características en relación con la variable objetivo.
Prueba Chi-Cuadrado
Prueba estadística que evalúa la independencia entre las características categóricas y la variable objetivo, utilizada para filtrar las variables no relevantes.
Prueba F de ANOVA
Método estadístico que compara las varianzas entre grupos para evaluar la importancia de las características numéricas en relación con una variable objetivo categórica.
Algoritmo Boruta
Algoritmo de selección de características basado en bosques aleatorios que compara la importancia de las características reales con características shadow generadas aleatoriamente.
SelectKBest
Método de selección univariada que elige las k características con las puntuaciones estadísticas más altas según una prueba específica (chi2, f_classif, mutual_info_classif).
Umbral de Varianza
Técnica de filtrado básica que elimina las características cuya varianza es inferior a un umbral predefinido, consideradas como poco informativas.
Selección Secuencial de Características
Método voraz que agrega o elimina secuencialmente características para optimizar una métrica de rendimiento del modelo según una estrategia forward o backward.
Algoritmo Genético para Selección de Características
Enfoque metaheurístico que utiliza los principios de selección natural para explorar el espacio de subconjuntos de características y encontrar una solución cuasi-óptima.
Valores SHAP
Método de interpretabilidad basado en la teoría de juegos que cuantifica el impacto de cada característica en las predicciones individuales del modelo.
Selección de Características Basada en Correlación
Método que evalúa la pertinencia de las características analizando su correlación con la variable objetivo mientras minimiza la redundancia entre características.
Ganancia de Información
Medida que cuantifica la reducción de entropía de la variable objetivo cuando se conoce una característica, utilizada para evaluar la pertinencia de las variables.
Algoritmo Relief
Algoritmo de filtrado de selección de características que evalúa la pertinencia de las variables comparando las distancias entre instancias similares y disímiles.
Selección Automática de Características
Proceso automatizado que combina múltiples técnicas de selección para identificar el subconjunto óptimo de características sin intervención manual.
Métodos Incorporados
Enfoques de selección de características integrados directamente en el proceso de entrenamiento del modelo, como los árboles de decisión o los métodos de regularización.
Métodos Wrapper
Técnicas de selección que utilizan un modelo de machine learning para evaluar la calidad de los subconjuntos de características mediante validación cruzada o métricas de rendimiento.