سياسات متعددة الأهداف - مسرد الذكاء الاصطناعي

📖

المصطلحات

دالة القيم متعددة الأهداف

امتداد متجهي لدالة القيم الكلاسيكية التي تقدر العوائد المتوقعة لكل هدف يتم النظر فيه بشكل منفصل. يسمح بالتقييم المتزامن لأداء السياسة وفقًا لمعايير متعددة.

📖

المصطلحات

سياسة التوازن

استراتيجية قرار تحافظ على توازن مستقر بين الأهداف المتضاربة المختلفة بمرور الوقت. تمثل حلاً مستدامًا في البيئات التي تتعارض فيها الأهداف.

📖

المصطلحات

متجه المكافأة

هيكل بيانات متعدد الأبعاد يحتوي على قيم المكافأة لكل هدف في كل مرحلة من مراحل التفاعل. يمثل العنصر الأساسي للتغذية الراجعة في أنظمة التعلم بالتعزيز متعدد الأهداف.

📖

المصطلحات

حدود باريتو

المجموعة الكاملة للحلول غير المهيمنة التي تمثل جميع المفاضلات المثلى الممكنة بين الأهداف. يتصور مساحة الحلول المرشحة في التعلم بالتعزيز متعدد الأهداف.

📖

المصطلحات

سياسة عشوائية متعددة الأهداف

توزيع احتمالات على الإجراءات التي تحسن عدة أهداف في نفس الوقت وفقًا لأوزان مختلفة. يسمح باستكشاف مفاضلات متنوعة بين الأهداف عند اتخاذ القرار.

📖

المصطلحات

فرط مستوى الترجيح

فضاء فرعي متجه يحدد الأوزان النسبية الممنوحة لكل هدف في التسلسل. يحدد اتجاه التحسين في الفضاء متعدد الأهداف.

📖

المصطلحات

مساحات الإجراء متعددة الأهداف

هياكل حيث يمكن لكل إجراء أن يؤثر بشكل مختلف على كل هدف يتم النظر فيه. تتطلب خوارزميات متخصصة لإدارة تعقيد القرارات متعددة المعايير.

📖

المصطلحات

التعلم بالتعزيز المسلسل

نموذج يحول المشكلة متعددة الأهداف إلى سلسلة من المشاكل أحادية الهدف عبر تسلسلات مختلفة. يسمح باستخدام الخوارزميات القياسية لاكتشاف مجموعة باريتو.

📖

المصطلحات

التحسين المحدب متعدد الأهداف

فئة من المشكلات حيث تكون دوال الهدف محدبة، مما يضمن خصائص نظرية قوية على الحلول المثلى. يسهل التقارب وتحليل السياسات متعددة الأهداف.

📖

المصطلحات

مقياس فرط الحجم

مؤشر أداء يقيس حجم مساحة الهدف المهيمن عليها بواسطة مجموعة من الحلول. يسمح بالمقارنة الكمية لمجموعات السياسات متعددة الأهداف.

📖

المصطلحات

السياسة السياقية متعددة الأهداف

نهج حيث تعتمد أوزان الأهداف على السياق أو حالة البيئة. يسمح بالتكيف الدقيق للتوازنات حسب المواقف التي تمت مواجهتها.

قاموس الذكاء الاصطناعي

دالة القيم متعددة الأهداف

سياسة التوازن

متجه المكافأة

حدود باريتو

سياسة عشوائية متعددة الأهداف

فرط مستوى الترجيح

مساحات الإجراء متعددة الأهداف

التعلم بالتعزيز المسلسل

التحسين المحدب متعدد الأهداف

مقياس فرط الحجم

السياسة السياقية متعددة الأهداف

لم يتم العثور على نتائج