Multi-Modal Transformers
Cross-Modal Alignment
Objectif d'entraînement visant à aligner sémantiquement les représentations de différentes modalités dans un espace partagé, permettant la correspondance entre concepts visuels et linguistiques.
← 返回