Мультимодальный QA
Визуальное рассуждение
Способность системы вопросно-ответного анализа (QA) выводить неявную информацию, анализируя пространственные отношения, атрибуты объектов или сложные сцены на изображении.
← Назад