Мультимодальные модели
Мультимодальные диффузионные модели
Генеративный подход, объединяющий процессы диффузии для создания согласованного контента одновременно в нескольких модальностях. Эти модели используют последовательный шум и кросс-модальные условия для генерации сложных выходов, таких как видео, синхронизированные с аудио, или изображения с подробными описаниями.
← Назад