Cuantización Estática
Representación INT4
Formato de cuantificación extrema que utiliza enteros de 4 bits (-8 a 7), reduciendo significativamente el tamaño del modelo pero introduciendo una pérdida de precisión notable que requiere técnicas de compensación especializadas.
← Volver