Transformers Multimodaux
Embedding Modality-Agnostic
Représentation vectorielle apprise par un modèle multimodal qui capture des sémantiques indépendantes de la modalité d'origine, permettant par exemple de retrouver une image à partir d'une requête textuelle.
← Zurück