Трансформеры и Архитектуры Внимания

📂

подкатегории

Самовнимание

Фундаментальный механизм, позволяющий трансформерам динамически вычислять относительную важность каждого элемента в последовательности по отношению к другим.

2 термины

📂

подкатегории

Многоголовое внимание

Расширение механизма самовнимания, в котором несколько голов внимания работают параллельно для захвата различных типов отношений в данных.

4 термины

📂

подкатегории

Позиционное кодирование

Техника, включающая информацию о последовательной позиции в эмбеддинги для компенсации отсутствия рекуррентности в трансформерах.

6 термины

📂

подкатегории

Архитектура кодировщик-декодировщик

Фундаментальная структура оригинальных трансформеров, объединяющая кодировщик для обработки входных данных и декодировщик для генерации выходных данных.

8 термины

📂

подкатегории

BERT (Bidirectional Encoder Representations)

Семейство предварительно обученных моделей на основе архитектуры кодировщика только с двунаправленным пониманием контекста.

10 термины

📂

подкатегории

GPT (Generative Pre-trained Transformer)

Архитектура только с декодером, оптимизированная для авторегрессивной генерации текста, формирующая основу больших языковых моделей.

5 термины

📂

подкатегории

Трансформеры для обработки изображений (ViT)

Применение архитектур трансформеров для обработки изображений путем разделения изображений на патчи и их обработки как последовательностей.

11 термины

📂

подкатегории

Механизмы разреженного внимания

Варианты внимания, снижающие вычислительную сложность за счет ограничения связей между элементами последовательности.

2 термины

📂

подкатегории

Перекрестное внимание

Механизм внимания, в котором запросы поступают из одной последовательности, а ключи и значения - из другой последовательности.

2 термины

📂

подкатегории

Законы масштабирования трансформеров

Эмпирические принципы, описывающие, как производительность трансформеров меняется в зависимости от размера модели, данных и вычислительных ресурсов.

18 термины

📂

подкатегории

Анализ голов внимания

Изучение специализированных ролей различных голов внимания в трансформерах для понимания их внутреннего функционирования.

19 термины

📂

подкатегории

Иерархическое внимание

Архитектура внимания, организованная на нескольких иерархических уровнях для обработки сложных структурированных данных.

9 термины

Глоссарий ИИ

Самовнимание

Многоголовое внимание

Позиционное кодирование

Архитектура кодировщик-декодировщик

BERT (Bidirectional Encoder Representations)

GPT (Generative Pre-trained Transformer)

Трансформеры для обработки изображений (ViT)

Механизмы разреженного внимания

Перекрестное внимание

Законы масштабирования трансформеров

Анализ голов внимания

Иерархическое внимание

Результаты не найдены