قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
POMDP (عملية قرار ماركوف ذات المراقبة الجزئية)
إطار نظري لنمذجة البيئات التي يدرك فيها الوكيل ملاحظة جزئية فقط للحالة الفعلية، مما يتطلب استدلالًا احتماليًا على الحالة المخفية لاتخاذ قرارات مثالية.
فضاء المراقبة
مجموعة الإشارات الحسية الجزئية التي يمكن لكل وكيل إدراكها من البيئة، ممثلة لمعلومات غير مكتملة عن الحالة العامة للنظام.
حالة الاعتقاد
توزيع احتمالي على فضاء الحالات المخفية يحافظ عليه الوكيل ويحدثه من ملاحظاته المتتالية لتمثل عدم اليقين لديه حول الحالة الفعلية للبيئة.
بروتوكول الاتصال
آلية تحدد متى وكيف وأي معلومات يمكن للوكلاء تبادلها فيما بينهم لتنسيق أفعالهم في بيئة ذات مراقبة جزئية.
التدريب المركزي مع التنفيذ اللامركزي
نهج حيث يتدرب الوكلاء باستخدام معلومات شاملة (حالات وأفعال الجميع) لكن ينفذون سياساتهم بشكل فردي باستخدام ملاحظاتهم المحلية فقط.
تحليل دالة القيمة
تقنية تحلل دالة القيمة الشاملة إلى مجموع دوال قيمة فردية أو محلية، مما يسمح بالتعلم اللامركزي مع الحفاظ على الاتساق الشامل.
نمذجة الخصوم
عملية استدلال سياسات أو نوايا الوكلاء الآخرين بناءً على سلوكياتهم المرصودة، حاسمة لاتخاذ القرار في البيئات التنافسية أو التعاونية.
مشكلة توزيع الفضل
صعوبة نسب المكافأة الشاملة بشكل صحيح لكل وكيل في نظام متعدد الوكلاء، معقدة بشكل خاص عندما تكون الملاحظات جزئية والأفعال مترابطة.
التعلم المشترك للفعل
طريقة يتعلم فيها الوكلاء تنسيق أفعالهم من خلال نمذجة التأثير الصريح للأفعال المجمعة على المكافأة الإجمالية، رغم القابلية الجزئية للملاحظة.
تقدير الحالة
عملية خوارزمية تسمح للوكيل باستنتاج الحالة العالمية الأكثر احتمالاً بناءً على ملاحظاته المحلية ونموذجه للبيئة.
مشاركة المعلومات
إستراتيجية تحدد كيفية توزيع الوكلاء وتجميع ملاحظاتهم المحلية لتحسين المعرفة الجماعية لحالة البيئة.
سجل الملاحظات المحلية
تسلسل زمني للملاحظات السابقة للوكيل، يُستخدم كسياق إضافي للتعويض عن نقص المعلومات حول الحالة العالمية الحالية.
القابلية الجزئية للملاحظة متعددة الوكلاء
حالة حيث لا يمكن لأي وكيل فردي مراقبة الحالة الكاملة للنظام، مما يتطلب إستراتيجيات للتنسيق والاستدلال لتحقيق أداء مثالي.
سياسة لا مركزية
دالة قرار لكل وكيل تربط سجل ملاحظاته المحلية بفعل، دون اعتماد مباشر على معلومات الوكلاء الآخرين أثناء التنفيذ.
المعرفة المشتركة
معلومات يعرفها جميع الوكلاء ويعلمون أن الآخرين يعرفونها أيضاً، وهي أساسية للتنسيق في البيئات ذات القابلية الجزئية للملاحظة.
رسم بياني للتنسيق
هيكل يمثل تبعيات التفاعل بين الوكلاء، مما يسمح بتحليل مشكلة القرار العالمية إلى مشكلات فرعية محلية أسهل في الحل.