Transformers Multimodaux
Audio-Visual Transformer
Modèle Transformer traitant simultanément les flux audio et vidéo pour des tâches comme la reconnaissance audiovisuelle ou la génération synchronisée.
← Wstecz