BERT e suas Variantes
ALBERT
Versão leve do BERT que reduz significativamente os parâmetros através da partilha de embeddings e da fatorização matricial das camadas. Mantém um desempenho competitivo enquanto é mais eficiente em termos de memória.
← Voltar