Glossário IA
O dicionário completo da Inteligência Artificial
Distribuição de Ações
Uma representação probabilística do conjunto de ações possíveis em um dado estado, permitindo que o agente escolha entre vários comportamentos válidos em vez de uma única ação determinística.
Mistura de Gaussianas sobre Ações
Uma técnica de modelagem onde a distribuição das ações é representada por uma mistura de várias distribuições gaussianas, permitindo capturar múltiplos e complexos modos de comportamento.
Reamostragem por Importância
Uma técnica estatística para estimar as propriedades de uma distribuição usando amostras de outra distribuição, aplicada para corrigir o viés ao aprender a partir de demonstrações multimodais.
Função de Perda de Divergência
Uma função objetivo que minimiza a divergência entre a distribuição das ações preditas pelo modelo e a distribuição das ações observadas nas demonstrações, favorecendo a aprendizagem de comportamentos multimodais.
Modo de Colapso
Um fenômeno onde um modelo de aprendizagem multimodal esquece certos modos da distribuição e se concentra em um subconjunto de comportamentos, reduzindo assim a diversidade das ações geradas.
Rede Neural Condicional
Uma arquitetura de rede neural cujos parâmetros ou saídas são condicionados por variáveis de entrada, usada para modelar distribuições de ações dependentes do estado do ambiente.
Demonstrações Heterogêneas
Um conjunto de dados de aprendizagem por imitação contendo demonstrações provenientes de diferentes estratégias ou especialistas, introduzindo naturalmente a multimodalidade nos comportamentos a serem aprendidos.
Agrupamento de Trajetórias
Uma técnica de agrupamento de sequências de ações e estados para identificar os diferentes modos de comportamento presentes nas demonstrações, facilitando a aprendizagem de políticas multimodais.
Rede Neural de Fluxo de Mistura
Uma arquitetura que combina múltiplas redes de fluxo para modelar uma distribuição complexa, particularmente adequada para representar distribuições de ações multimodais em aprendizagem por imitação.