BERT (Representações de Codificador Bidirecional)
BERT-base vs BERT-large
Duas configurações principais do BERT: base (12 camadas, 768 dimensões ocultas, 110M parâmetros) e large (24 camadas, 1024 dimensões, 340M parâmetros) para diferentes compromissos desempenho/recursos.
← Voltar