قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
دالة القيمة البايزية
تقدير القيمة المتوقعة للحالات أو الإجراءات مع الأخذ في الاعتبار عدم اليقين التوزيعي بشأن معلمات النموذج.
نموذج الانتقال البايزي
تمثيل احتمالي لديناميكيات البيئة حيث يتم التعامل مع احتمالات الانتقال كمتغيرات عشوائية ذات توزيعات.
السياسة البايزية المثلى
استراتيجية اتخاذ قرار تزيد من التوقع التراكمي للمكافأة على التوزيع اللاحق لمعلمات النموذج.
الاستكشاف الموجه بعدم اليقين
استراتيجية استكشاف تفضل الحالات أو الإجراءات التي تظهر أكبر قدر من عدم اليقين المعرفي لتسريع التعلم.
مرشحات الجسيمات البايزية
طرق الاستدلال المتسلسل التي تقرب التوزيعات اللاحقة بواسطة مجموعات مرجحة من العينات تسمى الجسيمات.
التعلم المعزز القائم على النماذج البايزية
نهج يقوم فيه الوكيل ببناء واستخدام نموذج بايزي للبيئة للتخطيط واتخاذ القرارات المثلى.
التوزيع التنبؤي اللاحق
توزيع احتمالي على الحالات المستقبلية يدمج كلاً من عدم يقين النموذج وعدم اليقين بشأن المعلمات.
الاستدلال السببي البايزي
استخدام الشبكات البايزية لنمذجة العلاقات السببية بين الإجراءات والعواقب في البيئة.
قطاع الطرق البايزيون
مشكلة مبسطة للتعلم المعزز حيث يختار الوكيل الإجراءات ذات المكافآت غير المؤكدة التي تم نمذجتها بطريقة بايزية.