Atenção Esparsa
Efficient Attention
Paradigma que engloba todas as variantes de atenção que visam reduzir a complexidade computacional, preservando as capacidades de modelagem dos Transformers.
← Voltar