Redes Feed-Forward
MLP de duas camadas
Arquitetura multicamadas padrão dos FFN nos Transformers composta por duas transformações lineares com uma função de ativação não linear entre elas.
← Voltar