Atención Dispersa
Efficient Attention
Paradigma que engloba todas las variantes de atención destinadas a reducir la complejidad computacional preservando las capacidades de modelado de los Transformers.
← Volver