Interpretabilidad Visión por computadora
Explicación de Preguntas y Respuestas Visuales (VQA)
Enfoques especializados que explican los razonamientos multimodales en los sistemas VQA, conectando explícitamente las regiones de imagen pertinentes con las palabras de la pregunta y la respuesta.
← Volver