Glossário IA
O dicionário completo da Inteligência Artificial
Modelo Multimodal
Arquitetura de inteligência artificial capaz de processar e integrar simultaneamente vários tipos de dados como texto, imagens, áudio e vídeo em um quadro unificado.
Fusão Precoce
Estratégia de integração multimodal onde as diferentes modalidades são combinadas no nível das características brutas antes do processamento pelo modelo principal.
Fusão Tardia
Abordagem multimodal onde cada modalidade é processada independentemente até as últimas camadas do modelo, antes de fundir as representações para a decisão final.
Alinhamento Cross-modal
Processo de aprendizagem que visa estabelecer correspondências semânticas entre diferentes modalidades em um espaço de representação comum.
Codificação Visão-Linguagem
Mecanismo que transforma simultaneamente entradas visuais e textuais em representações vetoriais compatíveis para o processamento conjunto.
Atenção Cross-modal
Mecanismo de atenção que permite ao modelo ponderar dinamicamente a importância das informações de uma modalidade em relação a outra.
Embeddings Multimodais
Representações vetoriais densas que codificam informações provenientes de várias modalidades em um espaço semântico compartilhado.
Aprendizagem Zero-shot Multimodal
Capacidade de um modelo multimodal de generalizar para novas tarefas ou combinações de modalidades sem exemplos de treinamento específicos.
Tokenização Multimodal
Processo de conversão de diferentes modalidades (imagem, áudio, vídeo) em sequências de tokens compatíveis com a arquitetura Transformer.
Pré-treinamento Contrastivo Multimodal
Método de auto-supervisão que maximiza a similaridade entre pares multimodais positivos enquanto minimiza a dos pares negativos.
Projeção em Espaço Latente Comum
Transformação linear ou não-linear que alinha os espaços de representação de diferentes modalidades em um espaço vetorial unificado.
Arquitetura Híbrida Codificador-Decodificador
Estrutura que combina codificadores especializados por modalidade com um decodificador unificado para geração de saídas multimodais.
Ajuste Fino Multimodal
Processo de adaptação de um modelo pré-treinado multimodal para tarefas específicas, preservando suas capacidades de processamento intermodal.
Engenharia de Prompt Multimodal
Técnica de otimização de entradas que combina texto e outras modalidades para guiar eficientemente modelos multimodais para saídas desejadas.
Raciocínio em Cadeia de Pensamento Multimodal
Capacidade de um modelo gerar etapas de raciocínio explícitas integrando evidências provenientes de múltiplas modalidades.
Geração Condicionada Multimodal
Processo de criação de conteúdo em uma modalidade alvo baseado em condições ou restrições fornecidas em outras modalidades.
Fusão Intermediária
Estratégia de integração multimodal onde as modalidades são fundidas em múltiplos níveis intermediários da rede neural.
Transformers Multimodais
Extensão da arquitetura Transformer capaz de processar simultaneamente sequências provenientes de diferentes modalidades com mecanismos de atenção adaptados.