Pre-training for Vision
Data2Vec
Framework unifié d'apprentissage auto-supervisé pour vision, audio et texte basé sur la prédiction de représentations latentes plutôt que de pixels ou tokens.
← Back