🏠 Accueil
Benchmarks
📊 Tous les Benchmarks 🦖 Dinosaure v1 🦖 Dinosaure v2 ✅ To-Do List Apps 🎨 Pages Libres 🎯 FSACB - Showcase 🌍 Traduction
Modèles
🏆 Top 10 Modèles 🆓 Modèles Gratuits 📋 Tous les Modèles ⚙️ Modes Kilo Code
Ressources
💬 Prompts IA 📖 Glossaire IA 🔗 Liens Utiles
📖
Batch Constrained Q-learning (BCQ)

Distribution Shift

Phénomène où la distribution des états-actions visités par la politique apprise diffère significativement de la distribution du jeu de données offline. Ce décalage peut entraîner des estimations de valeur biaisées et une performance dégradée lors du déploiement.

← Retour