BERT e suas Variantes
Funnel Transformers
Arquitetura hierárquica que reduz progressivamente o comprimento das sequências através das camadas, preservando a informação importante. Economiza significativamente a memória computacional para sequências longas.
← Voltar