🏠 Accueil
Benchmarks
📊 Tous les Benchmarks 🦖 Dinosaure v1 🦖 Dinosaure v2 ✅ To-Do List Apps 🎨 Pages Libres 🎯 FSACB - Showcase 🌍 Traduction
Modèles
🏆 Top 10 Modèles 🆓 Modèles Gratuits 📋 Tous les Modèles ⚙️ Modes Kilo Code
Ressources
💬 Prompts IA 📖 Glossaire IA 🔗 Liens Utiles
📖
Batch Constrained Q-learning (BCQ)

Batch RL

Cadre d'apprentissage par renforcement où l'agent dispose d'un lot fixe de transitions et doit apprendre une politique optimale sans interactions supplémentaires. Ce contexte impose des contraintes spécifiques sur les algorithmes pour éviter la divergence.

← Retour