Glosario IA
El diccionario completo de la Inteligencia Artificial
Conjunto de datos de calibración
Subconjunto representativo de los datos de entrenamiento utilizado para determinar los rangos de valores óptimos durante la cuantificación estática, esencial para calcular los factores de escala y puntos cero.
Descuantificación
Proceso inverso de la cuantificación que convierte los valores enteros de baja precisión de vuelta a coma flotante para los cálculos que requieren una precisión superior durante la inferencia.
Cuantificación de precisión mixta
Estrategia híbrida que aplica diferentes niveles de precisión (8-bit, 4-bit, 2-bit) a las diferentes capas del modelo según su sensibilidad a la cuantificación.
Cuantificación por canal
Técnica de cuantificación que aplica factores de escala distintos para cada canal de salida de una capa convolucional, mejorando significativamente la precisión para las CNN.
Cuantificación por tensor
Enfoque más simple que utiliza un solo factor de escala y punto cero para todo un tensor, menos preciso pero más rápido de calcular que la cuantificación por canal.
Rango de recorte
Rango de valores definido durante la calibración para limitar los extremos antes de la cuantificación, esencial para minimizar el error de cuantificación excluyendo los valores atípicos.
Cuantificación por capas
Método que optimiza independientemente los parámetros de cuantificación para cada capa de la red, teniendo en cuenta las características específicas de distribución de cada capa.
Error de cuantificación
Diferencia entre los valores originales en coma flotante y sus representaciones cuantificadas, medida por métricas como MSE o divergencia KL para evaluar la calidad de la cuantificación.
Inferencia solo con enteros
Paradigma de ejecución donde todas las operaciones del modelo se realizan en aritmética de enteros, eliminando completamente las conversiones de punto flotante para un rendimiento máximo.