BenchVibe AI Ecosystem

VIP 👤

🏠 الرئيسية

المقاييس

📊 جميع المقاييس 🦖 ديناصور v1 🦖 ديناصور v2 ✅ تطبيقات قائمة المهام 🎨 صفحات حرة إبداعية 🎯 FSACB - العرض النهائي 🌍 مقياس الترجمة

النماذج

🏆 أفضل 10 نماذج 🆓 نماذج مجانية 📋 جميع النماذج ⚙️ كيلو كود

الموارد

💬 مكتبة الأوامر 📖 قاموس الذكاء الاصطناعي 🔗 روابط مفيدة

📖

التعلم العميق بالتعزيز متعدد الأهداف

دالة القيمة المتجهة

امتداد لدالة القيمة Q في التعلم المعزز حيث كل حالة-إجراء ترتبط بمتجه من القيم، واحدة لكل هدف. هذه التمثيل يسمح بالتقاط الموازنات بين الأهداف المختلفة دون الحاجة إلى تجميع مسبق.

← رجوع