Glosario IA
El diccionario completo de la Inteligencia Artificial
Cuantificación de Pesos
Reducción de la precisión solo de los pesos del modelo, manteniendo las activaciones en precisión completa para un mejor equilibrio rendimiento/velocidad.
Cuantificación de Activaciones
Proceso de reducción de la precisión de las activaciones (salidas de las capas) además de los pesos para una optimización máxima del modelo.
Cuantificación de 8 bits
Conversión de los parámetros del modelo de 32 o 16 bits a 8 bits, reduciendo la memoria en un 75% con un impacto moderado en la precisión.
Cuantificación de 4 bits
Técnica extrema de reducción a 4 bits que permite grandes ganancias de memoria pero requiere algoritmos avanzados para mantener el rendimiento.
Cuantificación Dinámica
Cuantificación aplicada dinámicamente en la inferencia, adaptando los parámetros de cuantificación en tiempo real según los datos de entrada.
Cuantificación Estática
Pre-cálculo de los parámetros de cuantificación en un conjunto de calibración fijo, optimizando la velocidad pero requiriendo datos representativos.