Glossário IA
O dicionário completo da Inteligência Artificial
Modelagem de Sequências
Abordagem que formaliza o aprendizado por reforço como um problema de modelagem de sequências, onde estados, ações e recompensas são tratados como tokens em uma sequência temporal.
Transformer de Diferença Temporal
Variante de transformer que integra os princípios de diferença temporal na arquitetura de atenção, combinando aprendizado sequencial e atualização bootstrap das estimativas de valor.
Condicionamento de Trajetória
Técnica onde o gerador de trajetórias é condicionado a segmentos de trajetória parciais ou objetivos específicos, permitindo um controle preciso do comportamento gerado.
Previsão Multi-passos
Capacidade dos modelos transformer de prever múltiplos passos futuros de uma trajetória simultaneamente, melhorando a coerência a longo prazo das sequências estado-ação-recompensa geradas.
RL Distribucional
Extensão do aprendizado por reforço que modela a distribuição completa dos retornos em vez de apenas sua expectativa, capturando a incerteza nas previsões de trajetória.
Incorporação de Trajetória Baseada em Atenção
Representação vetorial das trajetórias obtida por mecanismos de atenção, capturando as dependências temporais complexas entre estados, ações e recompensas sucessivas.