Трансформеры и архитектура внимания

📂

подкатегории

Механизм внимания

Позволяет модели взвешивать важность различных частей входных данных при обработке.

10 термины

📂

подкатегории

Самовнимание

Механизм, в котором каждый элемент последовательности обращает внимание на все остальные элементы той же последовательности.

7 термины

📂

подкатегории

Многоголовое внимание

Расширение механизма самовнимания, использующее несколько голов внимания параллельно для захвата различных типов отношений.

8 термины

📂

подкатегории

Позиционное кодирование

Техника для встраивания позиционной информации в эмбеддинги без использования РНН.

19 термины

📂

подкатегории

Архитектура кодировщик-декодировщик

Фундаментальная структура трансформеров с кодировщиком для понимания и декодировщиком для генерации.

4 термины

📂

подкатегории

Масштабированное скалярное произведение внимания

Базовая математическая форма вычисления внимания с масштабированием в Трансформерах.

5 термины

📂

подкатегории

Сети прямого распространения

Полносвязные сети, применяемые после каждого слоя внимания в Трансформерах.

16 термины

📂

подкатегории

Нормализация слоя

Техника нормализации, применяемая в Трансформерах для стабилизации обучения.

6 термины

📂

подкатегории

Маски внимания

Механизм для контроля того, какие токены могут обращать внимание на другие токены.

19 термины

📂

подкатегории

Vision Transformers (ViT)

Применение архитектуры Transformer к обработке изображений путем разделения изображений на патчи.

14 термины

📂

подкатегории

Архитектура BERT

Трансформер, использующий только кодировщик, предобученный с задачами маскированного языкового моделирования

11 термины

📂

подкатегории

Архитектура GPT

Трансформер с декодером только, оптимизированный для авторегрессионной генерации текста.

8 термины

📂

подкатегории

Cross-Attention

Механизм внимания между двумя различными последовательностями в кодерах-декодерах.

5 термины

📂

подкатегории

Разреженное внимание

Вариант внимания, который уменьшает сложность, вычисляя только выборочные пары.

18 термины

📂

подкатегории

Иерархическое внимание

Многоуровневая архитектура, применяющая внимание на различных уровнях гранулярности.

12 термины

📂

подкатегории

Визуализация внимания

Техники для интерпретации и визуализации весов внимания в трансформерах.

17 термины

📂

подкатегории

Оптимизация трансформеров

Специфические методы эффективного обучения больших моделей трансформеров.

16 термины

📂

подкатегории

Мультимодальные трансформеры

Расширенная архитектура Трансформер для одновременной обработки нескольких типов данных.

18 термины

📂

подкатегории

Эффективные Трансформеры

Оптимизированные варианты Трансформеров для снижения вычислительной сложности.

9 термины

📂

подкатегории

Варианты механизмов внимания

Различные подходы и усовершенствования механизма внимания, выходящие за рамки скалярного произведения.

9 термины

Глоссарий ИИ

Механизм внимания

Самовнимание

Многоголовое внимание

Позиционное кодирование

Архитектура кодировщик-декодировщик

Масштабированное скалярное произведение внимания

Сети прямого распространения

Нормализация слоя

Маски внимания

Vision Transformers (ViT)

Архитектура BERT

Архитектура GPT

Cross-Attention

Разреженное внимание

Иерархическое внимание

Визуализация внимания

Оптимизация трансформеров

Мультимодальные трансформеры

Эффективные Трансформеры

Варианты механизмов внимания

Результаты не найдены