BenchVibe AI Ecosystem

VIP 👤

🏠 Home

Prestatietests

📊 Alle benchmarks 🦖 Dinosaur v1 🦖 Dinosaur v2 ✅ To-Do List applicaties 🎨 Creatieve vrije pagina's 🎯 FSACB - Ultieme showcase 🌍 Vertaalbenchmark

Modellen

🏆 Top 10 modellen 🆓 Gratis modellen 📋 Alle modellen ⚙️ Kilo Code

Bronnen

💬 Promptbibliotheek 📖 AI-woordenlijst 🔗 Nuttige links

📖

Stochastic Optimization in RL

Importance Sampling en RL

Technique permettant d'utiliser des données collectées avec une ancienne politique pour entraîner une nouvelle politique, en pondérant les échantillons par le rapport des densités.

← Terug