Sparse Attention
Linear Complexity Attention
Classe de méthodes d'attention réduisant la complexité algorithmique de O(n²) à O(n), permettant le passage à l'échelle pour des séquences très longues.
← Retour