قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
دالة القيم متعددة الأهداف
امتداد متجهي لدالة القيم الكلاسيكية التي تقدر العوائد المتوقعة لكل هدف يتم النظر فيه بشكل منفصل. يسمح بالتقييم المتزامن لأداء السياسة وفقًا لمعايير متعددة.
سياسة التوازن
استراتيجية قرار تحافظ على توازن مستقر بين الأهداف المتضاربة المختلفة بمرور الوقت. تمثل حلاً مستدامًا في البيئات التي تتعارض فيها الأهداف.
متجه المكافأة
هيكل بيانات متعدد الأبعاد يحتوي على قيم المكافأة لكل هدف في كل مرحلة من مراحل التفاعل. يمثل العنصر الأساسي للتغذية الراجعة في أنظمة التعلم بالتعزيز متعدد الأهداف.
حدود باريتو
المجموعة الكاملة للحلول غير المهيمنة التي تمثل جميع المفاضلات المثلى الممكنة بين الأهداف. يتصور مساحة الحلول المرشحة في التعلم بالتعزيز متعدد الأهداف.
سياسة عشوائية متعددة الأهداف
توزيع احتمالات على الإجراءات التي تحسن عدة أهداف في نفس الوقت وفقًا لأوزان مختلفة. يسمح باستكشاف مفاضلات متنوعة بين الأهداف عند اتخاذ القرار.
فرط مستوى الترجيح
فضاء فرعي متجه يحدد الأوزان النسبية الممنوحة لكل هدف في التسلسل. يحدد اتجاه التحسين في الفضاء متعدد الأهداف.
مساحات الإجراء متعددة الأهداف
هياكل حيث يمكن لكل إجراء أن يؤثر بشكل مختلف على كل هدف يتم النظر فيه. تتطلب خوارزميات متخصصة لإدارة تعقيد القرارات متعددة المعايير.
التعلم بالتعزيز المسلسل
نموذج يحول المشكلة متعددة الأهداف إلى سلسلة من المشاكل أحادية الهدف عبر تسلسلات مختلفة. يسمح باستخدام الخوارزميات القياسية لاكتشاف مجموعة باريتو.
التحسين المحدب متعدد الأهداف
فئة من المشكلات حيث تكون دوال الهدف محدبة، مما يضمن خصائص نظرية قوية على الحلول المثلى. يسهل التقارب وتحليل السياسات متعددة الأهداف.
مقياس فرط الحجم
مؤشر أداء يقيس حجم مساحة الهدف المهيمن عليها بواسطة مجموعة من الحلول. يسمح بالمقارنة الكمية لمجموعات السياسات متعددة الأهداف.
السياسة السياقية متعددة الأهداف
نهج حيث تعتمد أوزان الأهداف على السياق أو حالة البيئة. يسمح بالتكيف الدقيق للتوازنات حسب المواقف التي تمت مواجهتها.