Interprétabilité Vision par ordinateur
Visual Question Answering Explanation
Approches spécialisées expliquant les raisonnements multimodaux dans les systèmes VQA, en reliant explicitement les régions image pertinentes aux mots de la question et de la réponse.
← Retour