BERT (تمثيلات المُشفر ثنائي الاتجاه)
BERT-base vs BERT-large
تهيئتان رئيسيتان لـ BERT: الأساسي (12 طبقة، 768 بُعدًا مخفيًا، 110 مليون معلمة) والكبير (24 طبقة، 1024 بُعدًا، 340 مليون معلمة) لتوازنات مختلفة بين الأداء والموارد.
← رجوع