Tokenización
Tokenización por carácter
Enfoque de granularidad fina donde cada carácter individual se convierte en un token, eliminando así completamente el problema de las palabras fuera de vocabulario. Aunque teóricamente perfecta para la cobertura, este método aumenta considerablemente la longitud de las secuencias y reduce la eficiencia computacional.
← Volver