BERT et ses Variantes
ALBERT
Version allégée de BERT réduisant significativement les paramètres grâce au partage des embeddings et à la factorisation matricielle des couches. Maintient des performances compétitives tout en étant plus efficace en termes de mémoire.
← Retour