🏠 Inicio
Pruebas de rendimiento
📊 Todos los benchmarks 🦖 Dinosaurio v1 🦖 Dinosaurio v2 ✅ Aplicaciones To-Do List 🎨 Páginas libres creativas 🎯 FSACB - Showcase definitivo 🌍 Benchmark de traducción
Modelos
🏆 Top 10 modelos 🆓 Modelos gratuitos 📋 Todos los modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de prompts 📖 Glosario de IA 🔗 Enlaces útiles
📖
Deep RL Basado en Modelo

Optimización de Políticas Basada en Modelo (MBPO)

Algoritmo híbrido que utiliza modelos de corto alcance para generar datos sintéticos mientras mantiene un conjunto de datos reales para estabilizar el aprendizaje de la política.

← Volver