Интерпретируемость Компьютерное зрение
Объяснение визуального ответа на вопросы
Специализированные подходы, объясняющие multimodal-рассуждения в системах VQA, явно связывая релевантные области изображения со словами вопроса и ответа.
← Назад