Мультимодальный перевод
Мультимодальные трансформеры
Архитектура трансформеров, адаптированная для одновременной обработки нескольких модальностей данных (текст, изображение, аудио) с помощью механизмов кросс-модального внимания. Эти модели унифицируют представление и обработку гетерогенных данных.
← Назад