Arquitectura codificador-decodificador
Proyección de salida
Capa lineal final que proyecta las representaciones del decodificador hacia el espacio de vocabulario, seguida de un softmax para producir una distribución de probabilidad sobre los tokens posibles en cada posición de salida.
← Volver