BERT (Bidirectional Encoder Representations)
BERT-base vs BERT-large
Deux configurations principales de BERT : base (12 couches, 768 dimensions cachées, 110M paramètres) et large (24 couches, 1024 dimensions, 340M paramètres) pour différents compromis performance/ressources.
← पीछे