Deep Reinforcement Learning

📂

subcategorias

Redes Q Profundas (DQN)

Algoritmo pioneiro que combina Q-learning com redes neurais profundas para aproximar a função de valor Q em espaços de estado complexos.

18 termos

📂

subcategorias

Métodos de Gradiente de Política

Abordagens de aprendizado por reforço que otimizam diretamente a política seguindo o gradiente das recompensas esperadas.

18 termos

📂

subcategorias

Actor-Critic Methods

Architecture hybride combinant un acteur qui apprend la politique et un critique qui évalue la valeur des états ou des actions.

8 termos

📂

subcategorias

Deep Deterministic Policy Gradient (DDPG)

Algorithme actor-critic off-policy pour les environnements avec espaces d'action continus utilisant des réseaux de neurones profonds.

9 termos

📂

subcategorias

Proximal Policy Optimization (PPO)

Método de otimização de política que mantém as atualizações em uma região de confiança para garantir a estabilidade do aprendizado.

11 termos

📂

subcategorias

Trust Region Policy Optimization (TRPO)

Algoritmo de otimização com restrição que garante que as novas políticas não se afastem muito das políticas antigas.

8 termos

📂

subcategorias

Multi-Agent Deep RL

Extensão do deep RL onde múltiplos agentes aprendem simultaneamente, em cooperação ou competição em um ambiente compartilhado.

20 termos

📂

subcategorias

Aprendizagem por Reforço Hierárquico

Abordagem que estrutura o aprendizado em níveis hierárquicos com metapolíticas controlando subpolíticas especializadas.

20 termos

📂

subcategorias

Deep RL Baseado em Modelo

Técnica em que o agente aprende um modelo do ambiente para planejar e tomar decisões de forma mais eficiente.

19 termos

📂

subcategorias

RL Distribucional

Paradigma que aprende a distribuição completa dos retornos em vez de apenas sua expectativa para melhor robustez.

18 termos

📂

subcategorias

RL Guiado pela Curiosidade

Abordagem onde o agente recebe recompensas intrínsecas baseadas em sua curiosidade para explorar eficientemente o ambiente

16 termos

📂

subcategorias

Meta-Learning in RL

Técnica que permite aos agentes aprender a aprender rapidamente novas tarefas com poucas experiências.

18 termos

Glossário IA

Redes Q Profundas (DQN)

Métodos de Gradiente de Política

Actor-Critic Methods

Deep Deterministic Policy Gradient (DDPG)

Proximal Policy Optimization (PPO)

Trust Region Policy Optimization (TRPO)

Multi-Agent Deep RL

Aprendizagem por Reforço Hierárquico

Deep RL Baseado em Modelo

RL Distribucional

RL Guiado pela Curiosidade

Meta-Learning in RL

Nenhum resultado encontrado