BERT et ses Variantes
Funnel Transformers
Arquitectura jerárquica que reduce progresivamente la longitud de las secuencias a través de las capas preservando la información importante. Ahorra significativamente la memoria computacional para secuencias largas.
← Volver