Arquitetura Codificador-Decodificador
Projeção de Saída
Camada linear final que projeta as representações do decodificador para o espaço do vocabulário, seguida de um softmax para produzir uma distribuição de probabilidade sobre os tokens possíveis em cada posição de saída.
← Voltar