BERT (Bidirectional Encoder Representations)
BERT-base против BERT-large
Две основные конфигурации BERT: base (12 слоёв, 768 скрытых измерений, 110M параметров) и large (24 слоя, 1024 измерения, 340M параметров) для различных компромиссов между производительностью и ресурсами.
← Назад