Мультимодальный QA
Токенизация изображения
Процесс преобразования изображения в последовательность дискретных токенов, часто с помощью VAE или VQ-VAE, чтобы сделать его совместимым с архитектурами типа Transformer.
← Назад