Deep RL Baseado em Modelo

📖

termos

Aprendizagem por Reforço Profundo Baseado em Modelo

Abordagem de aprendizagem por reforço onde o agente constrói um modelo interno do ambiente para simular e planear as suas ações, reduzindo assim a necessidade de interações reais com o ambiente.

📖

termos

Modelo do Mundo

Representação neuronal completa do ambiente aprendendo simultaneamente a dinâmica do sistema, os estados latentes e as recompensas para permitir ao agente raciocinar num espaço simulado.

📖

termos

Controle Preditivo de Modelo (MPC)

Estratégia de controlo utilizando o modelo aprendido para otimizar uma sequência de ações futuras num horizonte temporal limitado, reavaliando continuamente o plano ótimo a cada passo de tempo.

📖

termos

Arquitetura Dyna

Framework integrando aprendizagem por reforço direto e indireto, onde as experiências simuladas geradas pelo modelo complementam os dados reais para acelerar a aprendizagem.

📖

termos

Agentes Aumentados com Imaginação (I2A)

Arquitetura de agente combinando política padrão com um percurso de imaginação utilizando o modelo ambiental para antecipar as consequências futuras antes de tomar uma decisão.

📖

termos

PlaNet

Algoritmo aprendendo um modelo de dinâmica num espaço latente compacto para resolver tarefas de controlo contínuas inteiramente por planeamento, sem política explícita.

📖

termos

Dreamer

Agente aprendendo um mundo no espaço dos sonhos onde ele treina em trajectórias imaginadas para aprender comportamentos e valores de forma totalmente latente.

📖

termos

MuZero

Algoritmo revolucionário aprendendo simultaneamente o modelo, a política e o valor sem conhecimento prévio das regras do ambiente, combinando MCTS e aprendizagem profunda.

📖

termos

Dinâmicas do Espaço Latente

Modelação da evolução temporal dos estados num espaço de representação comprimido onde as dinâmicas são mais simples e mais estáveis do que no espaço de observação bruto.

📖

termos

Incerteza do Modelo

Quantificação da incerteza do modelo ambiental, crucial para identificar as zonas onde o modelo é fiável e aquelas que necessitam de mais exploração ou interações reais.

📖

termos

Conjunto de Modelos

Técnica que utiliza vários modelos ambientais independentes para estimar a incerteza epistémica e melhorar a robustez das previsões para o planeamento.

📖

termos

Planeamento com Modelos Aprendidos

Processo de pesquisa sequencial que utiliza o modelo aprendido para avaliar diferentes sequências de ações futuras e selecionar a ótima segundo as previsões de recompensa.

📖

termos

Expansão de Valor Baseada em Modelo (MVE)

Técnica que utiliza o modelo para extrapolar os retornos para além do horizonte real, combinando dados reais e simulados para estimar com mais precisão os valores a longo prazo.

📖

termos

Otimização de Política Baseada em Modelo (MBPO)

Algoritmo híbrido que utiliza modelos de curto alcance para gerar dados sintéticos mantendo um conjunto de dados reais para estabilizar o aprendizado da política.

📖

termos

Otimização de Trajetória

Otimização direta das sequências de estados-ações utilizando o gradiente do modelo para encontrar trajetórias ótimas, particularmente eficaz para sistemas contínuos.

📖

termos

Motores de Física Diferenciáveis

Simuladores físicos implementados com operações diferenciáveis que permitem a propagação dos gradientes através das simulações para o aprendizado por reforço baseado em modelo.

📖

termos

Modelo de Dinâmica Direta

Modelo preditivo que aprende a transição de estado s_{t+1} = f(s_t, a_t) para antecipar as consequências futuras das ações no ambiente.

📖

termos

Modelo de Dinâmica Inversa

Modelo que aprende a inferir a ação a_t = f^{-1}(s_t, s_{t+1}) que levou de um estado a outro, útil para aprendizagem por imitação e representação de ações.

📖

termos

Exploração Baseada em Modelo

Estratégia de exploração que utiliza a incerteza do modelo para guiar o agente em direção aos estados onde o modelo tem menos confiança, favorecendo o aprendizado de uma representação mais completa.

Glossário IA

Aprendizagem por Reforço Profundo Baseado em Modelo

Modelo do Mundo

Controle Preditivo de Modelo (MPC)

Arquitetura Dyna

Agentes Aumentados com Imaginação (I2A)

PlaNet

Dreamer

MuZero

Dinâmicas do Espaço Latente

Incerteza do Modelo

Conjunto de Modelos

Planeamento com Modelos Aprendidos

Expansão de Valor Baseada em Modelo (MVE)

Otimização de Política Baseada em Modelo (MBPO)

Otimização de Trajetória

Motores de Física Diferenciáveis

Modelo de Dinâmica Direta

Modelo de Dinâmica Inversa

Exploração Baseada em Modelo

Nenhum resultado encontrado