BERT (Bidirectional Encoder Representations)
Transformer Encoder Stack
Architecture fondamentale de BERT composée de multiples couches encodeurs Transformer, chacune avec des mécanismes d'attention multi-têtes et des réseaux feed-forward.
← Retour