Glossário IA
O dicionário completo da Inteligência Artificial
Fusão de Modalidades
Técnicas para combinar e integrar eficazmente múltiplas fontes de dados heterogéneas numa representação unificada.
Aprendizagem Cross-Modal
Métodos que permitem aprender a partir de uma modalidade para melhorar o desempenho em outra modalidade diferente.
Representações Multimodais Compartilhadas
Criação de espaços de representação comuns onde diferentes modalidades podem ser comparadas e manipuladas juntas.
Alinhamento Modal
Processo de correspondência semântica entre elementos de diferentes modalidades (ex: palavras e regiões de imagem).
Tradução Multimodal
Conversão de dados de uma modalidade para outra, como a geração de texto a partir de imagens ou de imagens a partir de texto.
Atenção Multimodal
Mecanismos de atenção adaptados para ponderar e selecionar dinamicamente informações relevantes entre modalidades.
Visão e Linguagem
Subdomínio especializado na interação entre processamento de imagens e texto para tarefas como legendagem ou VQA.
Audiovisual
Processamento simultâneo e integrado de fluxos de áudio e vídeo para uma compreensão contextual enriquecida.
Aprendizagem Auto-Supervisionada Multimodal
Técnicas de aprendizagem sem rótulos que exploram as correlações naturais entre diferentes modalidades.
Transformers Multimodais
Arquiteturas baseadas em transformers adaptadas para processar simultaneamente vários tipos de dados.
Memória Multimodal
Sistemas de memória capazes de armazenar e recuperar eficientemente informações multimodais complexas.
Aprendizagem Multimodal Few-Shot
Técnicas que permitem a aprendizagem com muito poucos exemplos, explorando as relações entre modalidades.