Cuantización post-entrenamiento
Cuantificación de precisión mixta
Estrategia híbrida que aplica diferentes niveles de precisión (8-bit, 4-bit, 2-bit) a las diferentes capas del modelo según su sensibilidad a la cuantificación.
← Volver