Cuantificación y Optimización
Materialización de Bajo Rango (LoRA)
Método de adaptación eficiente que congela los pesos de un modelo pre-entrenado e inyecta pequeñas matrices de bajo rango descomponibles, reduciendo drásticamente el número de parámetros entrenables para el fine-tuning mientras preserva el rendimiento.
← Volver