Разреженное внимание
Эффективное внимание (Efficient Attention)
Парадигма, объединяющая все варианты механизма внимания, направленные на снижение вычислительной сложности при сохранении моделирующих возможностей архитектуры Трансформер.
← Назад