🏠 Inicio
Pruebas de rendimiento
📊 Todos los benchmarks 🦖 Dinosaurio v1 🦖 Dinosaurio v2 ✅ Aplicaciones To-Do List 🎨 Páginas libres creativas 🎯 FSACB - Showcase definitivo 🌍 Benchmark de traducción
Modelos
🏆 Top 10 modelos 🆓 Modelos gratuitos 📋 Todos los modelos ⚙️ Kilo Code
Recursos
💬 Biblioteca de prompts 📖 Glosario de IA 🔗 Enlaces útiles
📖
Planificación por Aprendizaje por Refuerzo

Moldeado de Recompensa (Reward Shaping)

Técnica de diseño de recompensas que modifica la función de recompensa original para guiar más eficazmente al agente hacia comportamientos de planificación deseables.

← Volver