Мультимодальные Трансформеры
Модально-Независимый Эмбеддинг
Векторное представление, изучаемое мультимодальной моделью, которое захватывает семантику, независимую от исходной модальности, позволяя, например, находить изображение по текстовому запросу.
← Назад