Apprentissage par Renforcement Profond

📂

sous-catégories

Deep Q-Networks (DQN)

Algorithme pionnier combinant Q-learning avec des réseaux de neurones profonds pour approximer la fonction de valeur Q dans des espaces d'états complexes.

18 termes

📂

sous-catégories

Policy Gradient Methods

Approches d'apprentissage par renforcement qui optimisent directement la politique en suivant le gradient des rewards attendus.

18 termes

📂

sous-catégories

Actor-Critic Methods

Architecture hybride combinant un acteur qui apprend la politique et un critique qui évalue la valeur des états ou des actions.

8 termes

📂

sous-catégories

Deep Deterministic Policy Gradient (DDPG)

Algorithme actor-critic off-policy pour les environnements avec espaces d'action continus utilisant des réseaux de neurones profonds.

9 termes

📂

sous-catégories

Proximal Policy Optimization (PPO)

Méthode d'optimisation de politique qui maintient les mises à jour dans une région de confiance pour garantir une stabilité d'apprentissage.

11 termes

📂

sous-catégories

Trust Region Policy Optimization (TRPO)

Algorithme d'optimisation contrainte qui garantit que les nouvelles politiques ne s'éloignent pas trop des anciennes politiques.

8 termes

📂

sous-catégories

Multi-Agent Deep RL

Extension du deep RL où plusieurs agents apprennent simultanément, en coopération ou en compétition dans un environnement partagé.

20 termes

📂

sous-catégories

Hierarchical Reinforcement Learning

Approche structurant l'apprentissage en niveaux hiérarchiques avec des méta-politiques contrôlant des sous-politiques spécialisées.

20 termes

📂

sous-catégories

Model-Based Deep RL

Technique où l'agent apprend un modèle de l'environnement pour planifier et prendre des décisions plus efficaces.

19 termes

📂

sous-catégories

Distributional RL

Paradigme apprenant la distribution complète des retours plutôt que seulement leur espérance pour une meilleure robustesse.

18 termes

📂

sous-catégories

Curiosity-Driven RL

Approche où l'agent reçoit des rewards intrinsèques basés sur sa curiosité pour explorer efficacement l'environnement.

16 termes

📂

sous-catégories

Meta-Learning in RL

Technique permettant aux agents d'apprendre à apprendre rapidement de nouvelles tâches avec peu d'expériences.

18 termes

Glossaire IA

Deep Q-Networks (DQN)

Policy Gradient Methods

Actor-Critic Methods

Deep Deterministic Policy Gradient (DDPG)

Proximal Policy Optimization (PPO)

Trust Region Policy Optimization (TRPO)

Multi-Agent Deep RL

Hierarchical Reinforcement Learning

Model-Based Deep RL

Distributional RL

Curiosity-Driven RL

Meta-Learning in RL

Aucun résultat trouvé