Glosario IA
El diccionario completo de la Inteligencia Artificial
Selección de características
Proceso de selección automática de las características más relevantes para un modelo supervisado eliminando variables redundantes o no informativas para mejorar el rendimiento y reducir la complejidad.
Codificación de etiquetas
Transformación de variables categóricas en valores numéricos enteros donde cada categoría única recibe un identificador numérico distinto, adecuado para algoritmos que requieren entradas numéricas.
Escalado de características
Normalización o estandarización de las características numéricas para llevarlas a un rango comparable, esencial para algoritmos sensibles a la escala de las variables como las SVM y las redes neuronales.
Características polinómicas
Generación de nuevas características mediante la creación de combinaciones polinómicas de las variables existentes, permitiendo capturar relaciones no lineales entre las características y la variable objetivo.
Características de interacción
Creación de nuevas variables que representan interacciones entre características existentes, típicamente mediante multiplicación o combinación, para revelar efectos sinérgicos en los datos supervisados.
Eliminación recursiva de características
Algoritmo de selección iterativa que construye un modelo, elimina las características menos importantes según un criterio específico, y repite este proceso hasta alcanzar el número óptimo de características.
Codificación objetivo
Técnica de transformación de variables categóricas utilizando estadísticas de la variable objetivo (media, mediana) para cada categoría, capturando así directamente la relación con la predicción.
Importancia de características
Medida cuantitativa del impacto de cada característica en las predicciones del modelo supervisado, calculada mediante métodos como permutation importance, valores SHAP o coeficientes del modelo.
Análisis de Componentes Principales
Técnica de reducción dimensional lineal que transforma las características en componentes ortogonales no correlacionadas, maximizando la varianza explicada con un número reducido de dimensiones.
Agrupación/Discretización
Proceso de conversión de variables continuas en categorías discretas (bins) para simplificar las relaciones, manejar valores atípicos y mejorar el rendimiento de ciertos algoritmos supervisados.
Hashing de Características
Técnica de dimensionalidad reducida que aplica una función de hash a las características para mapearlas en un espacio de dimensión fija, útil para datos de alta dimensionalidad con muchas categorías.
Imputación de Valores Faltantes
Conjunto de estrategias estadísticas o algorítmicas para reemplazar los valores faltantes en las características con estimaciones apropiadas, esencial para mantener la integridad de los datos supervisados.
Cruces de Características
Combinación de características para crear nuevas features que representan interacciones específicas, particularmente efectiva en modelos lineales para capturar relaciones no aditivas.
Pipeline de Ingeniería de Características
Secuencia automatizada y reproducible de transformaciones aplicadas a las características, integrando limpieza, creación, selección y escalado para garantizar la coherencia entre entrenamiento y predicción.
Creación de Características Específicas del Dominio
Desarrollo de características basadas en experiencia empresarial y conocimiento del dominio, creando variables informativas que capturan patrones específicos no evidentes en los datos brutos.
Ingeniería de Características Temporal
Creación de características específicas para datos temporales como lag features, estadísticas móviles, componentes temporales y tendencias estacionales para mejorar predicciones supervisadas cronológicas.