Vision Transformers для обнаружения
Token-to-Token ViT
Вариант, вводящий постепенный переход между токенами с изменением размера и рекомбинацией для сохранения локальной структурной информации.
← Назад