Atenção Multi-Cabeça
Atenção Linearizada
Família de mecanismos de atenção que reescrevem o cálculo da atenção para evitar a materialização da matriz de atenção completa, permitindo uma complexidade linear em relação ao comprimento da sequência.
← Voltar