Архитектура кодировщик-декодировщик
Стек декодировщиков
Наложение слоев декодировщика, которые генерируют выходную последовательность токен за токеном, объединяя как маскированное самовнимание, так и перекрёстное внимание для моделирования временных зависимостей и отношений вход-выход.
← Назад