Arquitetura Transformer
Camada de Dropout
Técnica de regularização que desativa aleatoriamente neurônios durante o treinamento para prevenir sobreajuste. Aplicada após as camadas de atenção e feed-forward nos Transformers.
← Voltar