Cuantización Estática

📖

términos

Escala y punto cero

Parámetros fundamentales de cuantificación donde la escala define el factor de conversión entre coma flotante y entero, mientras que el punto cero representa el valor entero correspondiente al cero en coma flotante.

📖

términos

Representación INT8

Formato de cuantificación que utiliza enteros con signo de 8 bits (-128 a 127) para representar los pesos y activaciones, ofreciendo un compromiso óptimo entre precisión y rendimiento computacional en la mayoría del hardware.

📖

términos

Representación INT4

Formato de cuantificación extrema que utiliza enteros de 4 bits (-8 a 7), reduciendo significativamente el tamaño del modelo pero introduciendo una pérdida de precisión notable que requiere técnicas de compensación especializadas.

📖

términos

Distribución de las Activaciones

Análisis estadístico de los valores de salida de las capas neuronales en un conjunto de datos de calibración, crucial para determinar los rangos de cuantificación óptimos y minimizar la pérdida de información.

📖

términos

Rango Dinámico

Diferencia entre los valores mínimos y máximos de las activaciones o pesos, determinando la resolución de cuantificación e influyendo directamente en la precisión del modelo cuantificado.

📖

términos

Sesgo de Cuantificación

Desviación sistemática introducida por la conversión a una representación de precisión reducida, la cual puede ser compensada mediante técnicas de ajuste estadístico durante la calibración.

📖

términos

Tabla de Búsqueda LUT

Estructura de datos precalculada que almacena las correspondencias entre valores cuantificados y descuantificados, optimizando las operaciones de conversión durante la inferencia para acelerar los cálculos.

📖

términos

Pérdida de Precisión

Degradación medible del rendimiento del modelo debido a la reducción de la precisión numérica, evaluada mediante métricas como la degradación de la exactitud o el aumento del error de predicción.

📖

términos

Optimización de Pesos

Proceso de ajuste fino de los pesos del modelo tras la cuantificación para compensar los errores introducidos, utilizando técnicas como la corrección de sesgos o el ajuste por lotes.

📖

términos

Calibración Min-Max

Técnica de calibración que utiliza los valores extremos observados en el conjunto de datos para definir el rango de cuantificación, simple pero sensible a los valores atípicos que pueden degradar la precisión.

📖

términos

Calibración por Percentil

Método de calibración robusto que utiliza percentiles (ej: 99,9%) en lugar de los valores extremos, evitando la influencia de los valores atípicos y optimizando el uso del rango dinámico.

📖

términos

Cuantificación por Capa

Enfoque que aplica parámetros de cuantificación idénticos a todos los pesos de una capa, simplificando la implementación pero potencialmente subóptima para los pesos con distribuciones variadas.

📖

términos

Cuantificación por Canal

Técnica avanzada que cuantifica independientemente cada canal de salida de una capa convolucional, preservando mejor la precisión a costa de una complejidad computacional ligeramente aumentada.

Glosario IA

Escala y punto cero

Representación INT8

Representación INT4

Distribución de las Activaciones

Rango Dinámico

Sesgo de Cuantificación

Tabla de Búsqueda LUT

Pérdida de Precisión

Optimización de Pesos

Calibración Min-Max

Calibración por Percentil

Cuantificación por Capa

Cuantificación por Canal

No se encontraron resultados