Tokenização Subword
Cobertura do Vocabulário
Métrica que avalia a proporção do corpus que pode ser representada sem tokens UNK, otimizada por algoritmos de subpalavras para atingir tipicamente mais de 99,9% de cobertura em corpora modernos.
← Voltar