Computación de Precisión Mixta
Post-Training Quantization (PTQ)
Proceso de conversión de un modelo preentrenado en precisión completa a una precisión reducida (FP16, INT8, INT4) sin reentrenamiento, utilizando técnicas de calibración para determinar los factores de escala y sesgo óptimos.
← Volver