Обучение с контрастивными потерями на нескольких представлениях
View-specific Encoder
Архитектура, содержащая отдельные кодировщики для каждого типа вида, позволяющая улавливать характеристики, присущие каждой модальности, перед их слиянием в общем пространстве.
← Назад