🏠 الرئيسية
المقاييس
📊 جميع المقاييس 🦖 ديناصور v1 🦖 ديناصور v2 ✅ تطبيقات قائمة المهام 🎨 صفحات حرة إبداعية 🎯 FSACB - العرض النهائي 🌍 مقياس الترجمة
النماذج
🏆 أفضل 10 نماذج 🆓 نماذج مجانية 📋 جميع النماذج ⚙️ كيلو كود
الموارد
💬 مكتبة الأوامر 📖 قاموس الذكاء الاصطناعي 🔗 روابط مفيدة
📖
التعلم بالتعزيز متعدد الأهداف المستمر

التعلم المعزز مع فضاء الإجراءات المستمر

نموذج في التعلم المعزز حيث يمكن للوكيل الاختيار من عدد لا نهائي من الإجراءات المستمرة، مما يتطلب خوارزميات تحسين مناسبة مثل PPO أو SAC.

← رجوع