Traduction Multimodale
Multimodal Transformers
Architecture transformer adaptée pour traiter simultanément plusieurs modalités de données (texte, image, audio) grâce à des mécanismes d'attention cross-modaux. Ces modèles unifient la représentation et le traitement de données hétérogènes.
← Volver