🏠 الرئيسية
المقاييس
📊 جميع المقاييس 🦖 ديناصور v1 🦖 ديناصور v2 ✅ تطبيقات قائمة المهام 🎨 صفحات حرة إبداعية 🎯 FSACB - العرض النهائي 🌍 مقياس الترجمة
النماذج
🏆 أفضل 10 نماذج 🆓 نماذج مجانية 📋 جميع النماذج ⚙️ كيلو كود
الموارد
💬 مكتبة الأوامر 📖 قاموس الذكاء الاصطناعي 🔗 روابط مفيدة

قاموس الذكاء الاصطناعي

القاموس الكامل للذكاء الاصطناعي

227
الفئات
2,955
الفئات الفرعية
34,512
المصطلحات
📖
المصطلحات

تقريب القيمة المتوقعة

طريقة تقليدية في التعلم المعزز (RL) تركز فقط على تقدير القيمة المتوقعة للعوائد المستقبلية. يتجاهل هذا النهج التباين واللحظات الأعلى لتوزيع العوائد.

📖
المصطلحات

معادلة بيلمان التوزيعية

تعميم لمعادلة بيلمان يعمل على التوزيعات العشوائية بدلاً من القيم العددية. يصف كيف ينتشر توزيع العوائد عبر انتقالات الحالات.

📖
المصطلحات

سياسة حساسة للمخاطر

استراتيجية عمل لا تأخذ في الاعتبار القيمة المتوقعة فحسب، بل أيضًا التباين أو الخصائص الأخرى لتوزيع العوائد. يمكن أن تكون هذه السياسات كارهة للمخاطر أو باحثة عنها حسب الأهداف.

📖
المصطلحات

دالة التوزيع التراكمي

دالة رياضية تعطي احتمال أن يأخذ متغير عشوائي قيمة أقل من أو تساوي عتبة معينة. في التعلم المعزز التوزيعي (distributional RL)، تمثل التوزيع الكامل للعوائد التراكمية.

📖
المصطلحات

مطابقة اللحظات

تقنية تقريب تسعى إلى مطابقة اللحظات الإحصائية (المتوسط، التباين، إلخ) للتوزيع المستهدف. تُستخدم أحيانًا لتبسيط تمثيل التوزيعات في التعلم المعزز (RL).

🔍

لم يتم العثور على نتائج