Мультимодальные модели
Визуально-языковое кодирование
Механизм, одновременно преобразующий визуальные и текстовые входные данные в совместимые векторные представления для совместной обработки.
← Назад