🏠 الرئيسية
المقاييس
📊 جميع المقاييس 🦖 ديناصور v1 🦖 ديناصور v2 ✅ تطبيقات قائمة المهام 🎨 صفحات حرة إبداعية 🎯 FSACB - العرض النهائي 🌍 مقياس الترجمة
النماذج
🏆 أفضل 10 نماذج 🆓 نماذج مجانية 📋 جميع النماذج ⚙️ كيلو كود
الموارد
💬 مكتبة الأوامر 📖 قاموس الذكاء الاصطناعي 🔗 روابط مفيدة
📖
التعلم المعزز العميق القائم على النموذج

الاستكشاف القائم على النموذج

استراتيجية استكشاف تستخدم عدم اليقين في النموذج لتوجيه الوكيل نحو الحالات التي يكون النموذج أقل ثقة فيها، مما يعزز تعلم تمثيل أكثر اكتمالاً.

← رجوع