🏠 Inicio
Pruebas de rendimiento
📊 Todos los benchmarks 🦖 Dinosaurio v1 🦖 Dinosaurio v2 ✅ Aplicaciones To-Do List 🎨 Páginas libres creativas 🎯 FSACB - Showcase definitivo 🌍 Benchmark de traducción
Modelos
🏆 Top 10 modelos 🆓 Modelos gratuitos 📋 Todos los modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de prompts 📖 Glosario de IA 🔗 Enlaces útiles
📖
Batch Constrained Q-learning (BCQ)

Distribution Shift

Phénomène où la distribution des états-actions visités par la politique apprise diffère significativement de la distribution du jeu de données offline. Ce décalage peut entraîner des estimations de valeur biaisées et une performance dégradée lors du déploiement.

← Volver