Трансформеры для обработки изображений (ViT)
Patch Merging
Операция в иерархических трансформерах, которая объединяет группы из 2x2 смежных патчей для создания токенов более низкого разрешения, увеличивая глубину и рецептивное поле.
← Назад