Atenção Esparsa
Reformer
Arquitetura que utiliza a sensibilidade à localidade (LSH) para limitar os cálculos de atenção aos pares mais semelhantes, com complexidade quase linear em comprimento de sequência.
← Voltar