Разреженное внимание
Pattern-based Attention
Стратегия, применяющая предопределенные паттерны разреженного внимания (например, фиксированные или изученные паттерны) для определения, какие пары запрос-ключ вычислять.
← Назад