QA Multimodal
Razonamiento Visual
Capacidad de un sistema QA para deducir información no explícita analizando las relaciones espaciales, los atributos de objetos o las escenas complejas en una imagen.
← Volver