🏠 Inicio
Pruebas de rendimiento
📊 Todos los benchmarks 🦖 Dinosaurio v1 🦖 Dinosaurio v2 ✅ Aplicaciones To-Do List 🎨 Páginas libres creativas 🎯 FSACB - Showcase definitivo 🌍 Benchmark de traducción
Modelos
🏆 Top 10 modelos 🆓 Modelos gratuitos 📋 Todos los modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de prompts 📖 Glosario de IA 🔗 Enlaces útiles
📖
Batch Constrained Q-learning (BCQ)

Batch RL

Cadre d'apprentissage par renforcement où l'agent dispose d'un lot fixe de transitions et doit apprendre une politique optimale sans interactions supplémentaires. Ce contexte impose des contraintes spécifiques sur les algorithmes pour éviter la divergence.

← Volver