QA Multimodal
Geração de Resposta Condicional
Processo onde um modelo de linguagem gera uma resposta textual cujo conteúdo é condicionado e guiado por informações extraídas de uma modalidade não textual, como uma imagem.
← Voltar