Glossário IA
O dicionário completo da Inteligência Artificial
Previsão de trajetória multi-passos
Técnica que consiste em antecipar uma sequência contínua de estados futuros ao longo de vários passos temporais para avaliar as consequências a longo prazo de uma ação antes da sua execução real.
Árvore de busca Monte Carlo
Algoritmo de exploração em árvore que utiliza simulações aleatórias para avaliar possíveis trajetórias futuras a partir de um dado estado, otimizando a seleção de ações.
Planeamento por antecipação
Processo de avaliação sequencial de ações futuras utilizando o modelo aprendido para selecionar a política ótima antes de qualquer interação com o ambiente real.
Modelo de dinâmica ambiental
Rede neural treinada para capturar as regras físicas e as mudanças de estado do ambiente para prever com precisão as consequências das ações do agente.
Imaginação de modelo
Capacidade do sistema de gerar mentalmente cenários e trajetórias alternativas utilizando o seu modelo interno do ambiente sem interação física.
Rollout de antecipação
Simulação completa de uma sequência de ações a partir de um estado inicial utilizando o modelo aprendido para avaliar a recompensa cumulativa esperada.
Aprendizagem por ensaio virtual
Paradigma onde o agente melhora principalmente através de experiências simuladas no seu modelo interno, em vez de interações diretas com o ambiente.
Modelo generativo de trajetórias
Arquitetura de deep learning que gera distribuições de trajetórias possíveis em vez de uma previsão determinística, capturando a natureza estocástica do ambiente.
Exploração por simulação
Estratégia de exploração onde o agente descobre novas políticas simulando massivamente cenários em seu modelo antes de testar os mais promissores na realidade.
Previsão de estado-ação
Modelo que prevê diretamente o próximo estado s(t+1) em função do estado atual s(t) e da ação a(t), formando a equação de transição fundamental.
Buffer de experiência imaginária
Estrutura de dados que armazena as trajetórias simuladas geradas pelo modelo para treinamento, complementando a experiência real coletada no ambiente.
Aprendizagem de modelo mundial
Abordagem onde um único modelo aprende a dinâmica completa do ambiente, compartilhado entre todas as tarefas e políticas para uma melhor generalização.
Rede de previsão de trajetória
Arquitetura neural especializada na previsão de sequências de estados futuros, frequentemente baseada em RNNs ou Transformers para capturar as dependências temporais.
Validação de modelo
Processo sistemático de avaliação da precisão preditiva do modelo em dados de validação (held-out) para garantir a confiabilidade das trajetórias simuladas.
Geração de contrafactuais
Técnica que cria trajetórias alternativas hipotéticas para entender o impacto de diferentes decisões e melhorar a compreensão causal do modelo.