QA Multimodal
Récupération d'Information Multimodal
Tâche consistant à retrouver des documents (ex: images) pertinents à partir d'une requête dans une autre modalité (ex: texte), en se basant sur leur similarité dans un espace d'embedding partagé.
← Retour