Glosario IA
El diccionario completo de la Inteligencia Artificial
Cuantización Estructuralmente Restringida
Técnica de compresión neuronal que aplica restricciones de cuantización específicas preservando la arquitectura y las relaciones estructurales de la red neuronal.
Entrenamiento Consciente de Cuantización (QAT)
Método de entrenamiento que simula los efectos de la cuantización durante el proceso de aprendizaje para minimizar la pérdida de precisión posterior a la cuantización.
Cuantización Post-Entrenamiento (PTQ)
Proceso de cuantización aplicado tras el entrenamiento completo del modelo sin necesidad de reentrenamiento adicional.
Granularidad de Cuantización
Nivel de detalle en el que los parámetros se agrupan para la cuantización, variando del nivel tensor al nivel canal o grupo.
Sesgo de Cuantización
Error sistemático introducido al convertir números de coma flotante a una representación de baja precisión.
Calibración de Cuantización
Proceso de determinación de los parámetros de cuantización óptimos (escala y punto cero) analizando la distribución de las activaciones.
Agrupamiento de Pesos
Técnica que agrupa pesos similares en clústeres que comparten un valor representativo común para reducir la complejidad.
Precisión Cuantificada
Número de bits utilizados para representar cada valor cuantificado, típicamente 8, 4, 2 o 1 bit en métodos extremos.
Rango Dinámico
Intervalo de valores que puede representar el formato cuantizado, crucial para preservar la información importante del modelo.
Cuantización de Baja Precisión
Compresión extrema que utiliza menos de 8 bits por parámetro, requiriendo técnicas avanzadas para mantener el rendimiento.
Reconstrucción de Pesos
Proceso de optimización que tiene como objetivo minimizar el error entre los pesos originales y sus versiones cuantizadas reconstruidas.
Optimización de la Estructura de Cuantización
Algoritmos que determinan automáticamente la configuración de cuantización óptima para cada parte de la red.
Sensibilidad a la Cuantización
Medida del impacto de la cuantización en el rendimiento de una capa específica, guiando las estrategias de cuantización heterogénea.
Cuantización con Restricciones Topológicas
Enfoque que preserva las propiedades topológicas de la red mientras aplica restricciones de cuantización específicas.