Arquitectura codificador-decodificador
Enmascaramiento causal
Técnica en el decodificador que enmascara todas las posiciones futuras para garantizar que la predicción para la posición i solo dependa de las posiciones 1 a i, respetando la naturaleza autorregresiva de la generación.
← Volver