BenchVibe AI Ecosystem

VIP 👤

🏠 Home

Benchmark Hub

📊 All Benchmarks 🦖 Dinosaur v1 🦖 Dinosaur v2 ✅ To-Do List Applications 🎨 Creative Free Pages 🎯 FSACB - Ultimate Showcase 🌍 Translation Benchmark

Models

🏆 Top 10 Models 🆓 Free Models 📋 All Models ⚙️ Kilo Code

Resources

💬 Prompts Library 📖 AI Glossary 🔗 Useful Links

📖

Stochastic Optimization in RL

Importance Sampling en RL

Technique permettant d'utiliser des données collectées avec une ancienne politique pour entraîner une nouvelle politique, en pondérant les échantillons par le rapport des densités.

← Back