🏠 Accueil
基準測試
📊 Tous les Benchmarks 🦖 Dinosaure v1 🦖 Dinosaure v2 ✅ To-Do List Apps 🎨 Pages Libres 🎯 FSACB - Showcase 🌍 Traduction
Modèles
🏆 Top 10 Modèles 🆓 Modèles Gratuits 📋 Tous les Modèles ⚙️ Modes Kilo Code
Ressources
💬 Prompts IA 📖 人工智能詞彙表 🔗 Liens Utiles
📖
批量约束Q学习(BCQ)

批量强化学习

强化学习的框架,其中智能体拥有固定的转换批次,并且必须在没有额外交互的情况下学习最优策略。这种背景对算法施加了特定约束以避免发散。

← 返回