Ajuste fino de modelos de difusión
Cuantificación de Pesos para Fine-tuning
Técnica de reducción de la precisión numérica de los pesos de un modelo de fine-tuning (ej: de FP32 a FP16 o INT8) para disminuir el tamaño del archivo y el uso de memoria, a menudo a costa de una ligera pérdida de calidad.
← Volver