Transformers pour Longues Séquences
Chunk-based Processing
Stratégie divisant les longues séquences en segments plus petits traités séquentiellement ou en parallèle avec des mécanismes de communication entre chunks. Permet de contourner les limitations de mémoire des architectures transformer standard.
← Terug