QA Multimodal
Recuperación de Información Multimodal
Tarea que consiste en recuperar documentos (ej: imágenes) relevantes a partir de una consulta en otra modalidad (ej: texto), basándose en su similitud en un espacio de embedding compartido.
← Volver