Визуальные трансформеры
Токенизация изображений
Процесс преобразования 2D-изображения в последовательность 1D-токенов, обрабатываемых трансформерами, включающий сегментацию на патчи и линейную проекцию. Эта токенизация является ключевым этапом, позволяющим адаптировать архитектуру трансформера, изначально разработанную для текста, к области компьютерного зрения.
← Назад