Batch Constrained Q-learning (BCQ) - مسرد الذكاء الاصطناعي

VIP 👤

المقاييس

📊 جميع المقاييس 🦖 ديناصور v1 🦖 ديناصور v2 ✅ تطبيقات قائمة المهام 🎨 صفحات حرة إبداعية 🎯 FSACB - العرض النهائي 🌍 مقياس الترجمة

النماذج

🏆 أفضل 10 نماذج 🆓 نماذج مجانية 📋 جميع النماذج ⚙️ كيلو كود

الموارد

💬 مكتبة الأوامر 📖 قاموس الذكاء الاصطناعي 🔗 روابط مفيدة

📖

Batch Constrained Q-learning (BCQ)

Algorithme d'apprentissage par renforcement offline qui contraint les politiques à rester proches des actions observées dans le jeu de données d'entraînement pour éviter les erreurs d'extrapolation. BCQ utilise un modèle de générateur d'actions pour produire des actions similaires à celles du batch tout en explorant de légères variations.

← رجوع