BERT et ses Variantes
VideoBERT
Extension multimodale de BERT apprenant les représentations vidéo-texte jointes. Effectue le pré-entraînement sur des tokens visuels et linguistiques pour la compréhension vidéo.
← Retour