Normalización y Estandarización

📖

términos

Escalado robusto

Técnica que utiliza cuantiles para resistir valores atípicos, típicamente aplicando (x - mediana)/IQR donde IQR representa el rango intercuartílico. Este enfoque mantiene la estabilidad de las transformaciones incluso en presencia de datos ruidosos o extremos.

📖

términos

Normalización L1

Método de escalado que divide cada valor por la suma absoluta de todos los valores en el vector, garantizando que la norma L1 sea igual a 1. Esta transformación es particularmente útil para modelos basados en probabilidades y representaciones dispersas.

📖

términos

Normalización L2

Procedimiento que normaliza vectores dividiendo cada componente por la raíz cuadrada de la suma de cuadrados, asegurando una norma euclidiana unitaria. Esta técnica es esencial para algoritmos sensibles a la magnitud vectorial como SVM y redes neuronales.

📖

términos

Normalización por cuantil

Técnica no paramétrica que transforma los datos para seguir una distribución uniforme o normal especificada utilizando funciones de distribución de cuantiles. Este enfoque es particularmente efectivo para manejar distribuciones fuertemente asimétricas o multimodales.

📖

términos

Escalado por unidad de vector

Normalización que divide cada vector por su norma euclidiana, resultando en vectores de longitud unitaria en el espacio multidimensional. Este método es crucial para algoritmos basados en medidas de similitud coseno y representaciones textuales.

📖

términos

Normalización decimal

Técnica simple que divide los valores por una potencia de 10 para llevarlos al intervalo [-1,1], basándose en el número máximo de dígitos antes del punto decimal. Este método preserva el orden de magnitud relativo mientras reduce la escala numérica absoluta.

📖

términos

Estandarización robusta

Variante de la estandarización que utiliza la mediana y la desviación absoluta mediana (MAD) como medidas de tendencia central y dispersión, ofreciendo mayor resistencia a valores atípicos. Este enfoque mantiene la interpretabilidad mientras garantiza robustez.

📖

términos

Escalado logarítmico

Transformación que aplica log(x + c) donde c es una constante para manejar valores nulos, comprimiendo efectivamente la escala de valores grandes. Este método es particularmente adecuado para datos que siguen una ley de potencia o presentan asimetría derecha.

📖

términos

Normalización por rango

Técnica no paramétrica que reemplaza cada valor por su rango normalizado en el conjunto de datos, eliminando la influencia de valores extremos. Este enfoque es robusto ante valores atípicos y preserva únicamente el orden relativo de las observaciones.

📖

términos

Estandarización por mediana

Método que centra los datos alrededor de la mediana en lugar de la media, dividiendo por una medida de dispersión robusta como el rango intercuartílico. Este enfoque ofrece una mejor resistencia a distribuciones asimétricas y valores aberrantes.

📖

términos

Escalado por máximo absoluto

Técnica simple que divide cada valor por el valor absoluto máximo de la característica, preservando los signos y los ceros mientras limita los valores en [-1,1]. Este método es particularmente eficaz para datos ya centrados o dispersos.

📖

términos

Normalización por varianza

Procedimiento que estandariza las variables dividiendo por su varianza, igualando así la importancia de cada característica en algoritmos sensibles a la escala. Este enfoque es particularmente útil para el análisis de componentes principales y la regresión ridge.

📖

términos

Estandarización por coeficiente de variación

Método avanzado que normaliza los datos dividiendo por el coeficiente de variación (σ/μ), permitiendo comparar variables con medias y varianzas diferentes. Esta técnica es particularmente relevante para datos donde la variabilidad relativa es más importante que la variabilidad absoluta.

Glosario IA

Escalado robusto

Normalización L1

Normalización L2

Normalización por cuantil

Escalado por unidad de vector

Normalización decimal

Estandarización robusta

Escalado logarítmico

Normalización por rango

Estandarización por mediana

Escalado por máximo absoluto

Normalización por varianza

Estandarización por coeficiente de variación

No se encontraron resultados