🏠 Accueil
Benchmarks
📊 Tous les Benchmarks 🦖 Dinosaure v1 🦖 Dinosaure v2 ✅ To-Do List Apps 🎨 Pages Libres 🎯 FSACB - Showcase 🌍 Traduction
Modèles
🏆 Top 10 Modèles 🆓 Modèles Gratuits 📋 Tous les Modèles ⚙️ Modes Kilo Code
Ressources
💬 Prompts IA 📖 Glossaire IA 🔗 Liens Utiles

Glossaire IA

Le dictionnaire complet de l'Intelligence Artificielle

242
catégories
3 353
sous-catégories
40 780
termes
📂
sous-catégories

Deep Q-Networks (DQN)

Algorithme pionnier combinant Q-learning avec des réseaux de neurones profonds pour approximer la fonction de valeur Q dans des espaces d'états complexes.

18 termes
📂
sous-catégories

Policy Gradient Methods

Approches d'apprentissage par renforcement qui optimisent directement la politique en suivant le gradient des rewards attendus.

18 termes
📂
sous-catégories

Actor-Critic Methods

Architecture hybride combinant un acteur qui apprend la politique et un critique qui évalue la valeur des états ou des actions.

8 termes
📂
sous-catégories

Deep Deterministic Policy Gradient (DDPG)

Algorithme actor-critic off-policy pour les environnements avec espaces d'action continus utilisant des réseaux de neurones profonds.

9 termes
📂
sous-catégories

Proximal Policy Optimization (PPO)

Méthode d'optimisation de politique qui maintient les mises à jour dans une région de confiance pour garantir une stabilité d'apprentissage.

11 termes
📂
sous-catégories

Trust Region Policy Optimization (TRPO)

Algorithme d'optimisation contrainte qui garantit que les nouvelles politiques ne s'éloignent pas trop des anciennes politiques.

8 termes
📂
sous-catégories

Multi-Agent Deep RL

Extension du deep RL où plusieurs agents apprennent simultanément, en coopération ou en compétition dans un environnement partagé.

20 termes
📂
sous-catégories

Hierarchical Reinforcement Learning

Approche structurant l'apprentissage en niveaux hiérarchiques avec des méta-politiques contrôlant des sous-politiques spécialisées.

20 termes
📂
sous-catégories

Model-Based Deep RL

Technique où l'agent apprend un modèle de l'environnement pour planifier et prendre des décisions plus efficaces.

19 termes
📂
sous-catégories

Distributional RL

Paradigme apprenant la distribution complète des retours plutôt que seulement leur espérance pour une meilleure robustesse.

18 termes
📂
sous-catégories

Curiosity-Driven RL

Approche où l'agent reçoit des rewards intrinsèques basés sur sa curiosité pour explorer efficacement l'environnement.

16 termes
📂
sous-catégories

Meta-Learning in RL

Technique permettant aux agents d'apprendre à apprendre rapidement de nouvelles tâches avec peu d'expériences.

18 termes
🔍

Aucun résultat trouvé