Tokenisation
WordPiece
Variante du BPE développée par Google qui maximise la probabilité du langage lors de la fusion des tokens, utilisée notamment dans les modèles BERT et ses variantes.
← Retour