Glosario IA
El diccionario completo de la Inteligencia Artificial
Escalado robusto
Técnica que utiliza cuantiles para resistir valores atípicos, típicamente aplicando (x - mediana)/IQR donde IQR representa el rango intercuartílico. Este enfoque mantiene la estabilidad de las transformaciones incluso en presencia de datos ruidosos o extremos.
Normalización L1
Método de escalado que divide cada valor por la suma absoluta de todos los valores en el vector, garantizando que la norma L1 sea igual a 1. Esta transformación es particularmente útil para modelos basados en probabilidades y representaciones dispersas.
Normalización L2
Procedimiento que normaliza vectores dividiendo cada componente por la raíz cuadrada de la suma de cuadrados, asegurando una norma euclidiana unitaria. Esta técnica es esencial para algoritmos sensibles a la magnitud vectorial como SVM y redes neuronales.
Normalización por cuantil
Técnica no paramétrica que transforma los datos para seguir una distribución uniforme o normal especificada utilizando funciones de distribución de cuantiles. Este enfoque es particularmente efectivo para manejar distribuciones fuertemente asimétricas o multimodales.
Escalado por unidad de vector
Normalización que divide cada vector por su norma euclidiana, resultando en vectores de longitud unitaria en el espacio multidimensional. Este método es crucial para algoritmos basados en medidas de similitud coseno y representaciones textuales.
Normalización decimal
Técnica simple que divide los valores por una potencia de 10 para llevarlos al intervalo [-1,1], basándose en el número máximo de dígitos antes del punto decimal. Este método preserva el orden de magnitud relativo mientras reduce la escala numérica absoluta.
Estandarización robusta
Variante de la estandarización que utiliza la mediana y la desviación absoluta mediana (MAD) como medidas de tendencia central y dispersión, ofreciendo mayor resistencia a valores atípicos. Este enfoque mantiene la interpretabilidad mientras garantiza robustez.
Escalado logarítmico
Transformación que aplica log(x + c) donde c es una constante para manejar valores nulos, comprimiendo efectivamente la escala de valores grandes. Este método es particularmente adecuado para datos que siguen una ley de potencia o presentan asimetría derecha.
Normalización por rango
Técnica no paramétrica que reemplaza cada valor por su rango normalizado en el conjunto de datos, eliminando la influencia de valores extremos. Este enfoque es robusto ante valores atípicos y preserva únicamente el orden relativo de las observaciones.
Estandarización por mediana
Método que centra los datos alrededor de la mediana en lugar de la media, dividiendo por una medida de dispersión robusta como el rango intercuartílico. Este enfoque ofrece una mejor resistencia a distribuciones asimétricas y valores aberrantes.
Escalado por máximo absoluto
Técnica simple que divide cada valor por el valor absoluto máximo de la característica, preservando los signos y los ceros mientras limita los valores en [-1,1]. Este método es particularmente eficaz para datos ya centrados o dispersos.
Normalización por varianza
Procedimiento que estandariza las variables dividiendo por su varianza, igualando así la importancia de cada característica en algoritmos sensibles a la escala. Este enfoque es particularmente útil para el análisis de componentes principales y la regresión ridge.
Estandarización por coeficiente de variación
Método avanzado que normaliza los datos dividiendo por el coeficiente de variación (σ/μ), permitiendo comparar variables con medias y varianzas diferentes. Esta técnica es particularmente relevante para datos donde la variabilidad relativa es más importante que la variabilidad absoluta.