Modèles Multimodaux
Modèle de Diffusion Multimodal
Architecture de génération qui utilise un processus de bruitage et de débruitage itératif pour créer des données (ex: images) conditionnées par une autre modalité (ex: une description textuelle), en guidant le débruitage avec l'information de conditionnement.
← Retour