Glosario IA
El diccionario completo de la Inteligencia Artificial
Escala y punto cero
Parámetros fundamentales de cuantificación donde la escala define el factor de conversión entre coma flotante y entero, mientras que el punto cero representa el valor entero correspondiente al cero en coma flotante.
Representación INT8
Formato de cuantificación que utiliza enteros con signo de 8 bits (-128 a 127) para representar los pesos y activaciones, ofreciendo un compromiso óptimo entre precisión y rendimiento computacional en la mayoría del hardware.
Representación INT4
Formato de cuantificación extrema que utiliza enteros de 4 bits (-8 a 7), reduciendo significativamente el tamaño del modelo pero introduciendo una pérdida de precisión notable que requiere técnicas de compensación especializadas.
Distribución de las Activaciones
Análisis estadístico de los valores de salida de las capas neuronales en un conjunto de datos de calibración, crucial para determinar los rangos de cuantificación óptimos y minimizar la pérdida de información.
Rango Dinámico
Diferencia entre los valores mínimos y máximos de las activaciones o pesos, determinando la resolución de cuantificación e influyendo directamente en la precisión del modelo cuantificado.
Sesgo de Cuantificación
Desviación sistemática introducida por la conversión a una representación de precisión reducida, la cual puede ser compensada mediante técnicas de ajuste estadístico durante la calibración.
Tabla de Búsqueda LUT
Estructura de datos precalculada que almacena las correspondencias entre valores cuantificados y descuantificados, optimizando las operaciones de conversión durante la inferencia para acelerar los cálculos.
Pérdida de Precisión
Degradación medible del rendimiento del modelo debido a la reducción de la precisión numérica, evaluada mediante métricas como la degradación de la exactitud o el aumento del error de predicción.
Optimización de Pesos
Proceso de ajuste fino de los pesos del modelo tras la cuantificación para compensar los errores introducidos, utilizando técnicas como la corrección de sesgos o el ajuste por lotes.
Calibración Min-Max
Técnica de calibración que utiliza los valores extremos observados en el conjunto de datos para definir el rango de cuantificación, simple pero sensible a los valores atípicos que pueden degradar la precisión.
Calibración por Percentil
Método de calibración robusto que utiliza percentiles (ej: 99,9%) en lugar de los valores extremos, evitando la influencia de los valores atípicos y optimizando el uso del rango dinámico.
Cuantificación por Capa
Enfoque que aplica parámetros de cuantificación idénticos a todos los pesos de una capa, simplificando la implementación pero potencialmente subóptima para los pesos con distribuciones variadas.
Cuantificación por Canal
Técnica avanzada que cuantifica independientemente cada canal de salida de una capa convolucional, preservando mejor la precisión a costa de una complejidad computacional ligeramente aumentada.