Transformers Multimodais
Embedding Agnóstico à Modalidade
Representação vetorial aprendida por um modelo multimodal que captura semânticas independentes da modalidade de origem, permitindo, por exemplo, recuperar uma imagem a partir de uma consulta textual.
← Voltar