قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
الاستكشاف العشوائي متعدد الوكلاء
استراتيجية استكشاف حيث يستخدم كل وكيل سياسات احتمالية لاكتشاف البيئة مع الأخذ في الاعتبار عدم اليقين الناتج عن الوكلاء الآخرين. تتيح هذه المقاربة الحفاظ على توازن بين الاستكشاف الفردي والتنسيق الجماعي في الأنظمة الديناميكية.
توازن الاستكشاف والاستغلال متعدد الوكلاء
معضلة أساسية في التعلم المعزز متعدد الوكلاء حيث يجب على الوكلاء الاختيار بين اكتشاف استراتيجيات جديدة أو استغلال المعرفة المكتسبة، مع مراعاة التفاعلات بين الوكلاء. تزداد التعقيد بشكل كبير مع عدد الوكلاء في النظام.
الاستكشاف القائم على الفضول متعدد الوكلاء
آلية استكشاف جوهرية حيث يكون كل وكيل مدفوعًا بفضوله الخاص أثناء التفاعل مع فضول الوكلاء الآخرين لاكتشاف حالات معقدة. تجمع هذه المقاربة بين المكافآت الجوهرية الفردية ومكافآت الاكتشاف التعاوني.
الاستكشاف التنافسي متعدد الوكلاء
استراتيجية استكشاف حيث يؤثر الوكلاء ذوو الأهداف المتعارضة على بعضهم البعض في عملية اكتشاف البيئة. يخلق هذا التكوين ديناميكية استكشاف تطورية حيث يجب على كل وكيل التكيف مع استراتيجيات الاستكشاف الخاصة بمنافسيه.
الاستكشاف بالتنسيق اللامركزي
مقاربة حيث يستكشف الوكلاء البيئة بشكل مستقل مع تطوير آليات تنسيق ضمنية لتجنب التكبير وتعظيم التغطية. يتواصل الوكلاء محليًا لمزامنة استراتيجيات الاستكشاف دون مركزية.
الاستكشاف السياقي التكيفي
طريقة استكشاف تُكيّف ديناميكيًا استراتيجيات الوكلاء بناءً على السياق العام والمحلي للبيئة متعددة الوكلاء. يضبط الوكلاء معدل استكشافهم بناءً على كثافة الوكلاء وتعقيد المنطقة المستكشفة.
الاستكشاف بالتعلم الاجتماعي
عملية استكشاف حيث يتعلم الوكلاء استراتيجيات استكشاف فعالة من خلال مراقبة وتقليد سلوكيات الوكلاء الآخرين في النظام. تجمع هذه المقاربة بين الاستكشاف الفردي والاستغلال الجماعي للمعرفة المكتسبة.
الاستكشاف بالتواصل الضمني
استراتيجية حيث يستنتج الوكلاء نوايا وخطط الاستكشاف للوكلاء الآخرين من خلال أفعالهم السابقة والحالية. يسمح هذا التواصل غير المباشر بتنسيق فعال دون تبادل صريح للمعلومات.
الاستكشاف بالتقليد متعدد الوكلاء
تقنية استكشاف يتعلم فيها الوكلاء الاستكشاف من خلال تقليد المسارات الاستكشافية الناجحة لوكلاء خبراء أو معرضين. هذا النهج يسرع اكتشاف الحالات ذات الصلة مع الحفاظ على التنوع الاستكشافي.
الاستكشاف بشبكات العصبية البيانية
نهج يستخدم الشبكات العصبية البيانية لنمذجة العلاقات بين الوكلاء وتوجيه الاستكشاف التعاوني بالاعتماد على طوبولوجيا شبكة التفاعلات. يستغل الوكلاء البنية العلائقية لتحسين قراراتهم الاستكشافية.
الاستكشاف بالانتباه متعدد الوكلاء
آلية استكشاف يستخدم فيها كل وكيل آليات الانتباه للتركيز على الإجراءات والحالات ذات الصلة للوكلاء الآخرين. يتيح هذا النهج استكشافاً انتقائياً قائماً على الأهمية النسبية للمعلومات بين الوكلاء.
الاستكشاف بالسياسات الهرمية
بنية استكشاف متعددة المستويات توجه فيها السياسات الفوقية استراتيجيات الاستكشاف الأساسية للوكلاء بناءً على الأهداف الشاملة للنظام. تتيح هذه الهرمية استكشافاً متناسقاً على مستويات زمنية ومكانية مختلفة.
الاستكشاف بفصل فضاء الإجراءات
تقنية تفصل استكشاف فضاء الحالات عن استكشاف فضاء الإجراءات لإدارة التعقيد الأسي في البيئات متعددة الوكلاء. يستكشف الوكلاء أبعاد الحالة والإجراءات بشكل مستقل قبل دمجها.
الاستكشاف بالتحسين البايزي
نهج استكشاف يستخدم العمليات الغوسية لنمذجة عدم اليقين وتوجيه الوكلاء نحو المناطق الواعدة من فضاء الحالات-الإجراءات. تحسن هذه الطريقة الكفاءة الاستكشافية بالاعتماد على الاستدلالات الاحتمالية.
الاستكشاف بمسألة المتعدد السياقية متعددة الوكلاء
إطار استكشاف يعامل فيه كل وكيل الوكلاء الآخرين كسياق متطور في مشكلة متعدد ذو أذرع متعددة. يتعلم الوكلاء الاستكشاف من خلال التكيف الديناميكي مع تغيرات السياق.
الاستكشاف بالتعلم الفوقي
نهج يتعلم فيه الوكلاء استراتيجيات فوقية للاستكشاف يمكنها التكيف بسرعة مع تكوينات متعددة الوكلاء جديدة. تنقل هذه التقنية المعارف الاستكشافية المكتسبة في بيئة ما إلى سياقات مماثلة أخرى.
الاستكشاف بالتبريد المحاكي الموزع
خوارزمية استكشاف موزعة حيث يحتفظ كل وكيل بدرجة حرارة التبريد الخاصة به مع التنسيق العالمي لعملية التبريد. تتيح هذه الطريقة استكشافًا شاملًا أوليًا يتبعه تقارب تدريجي.
الاستكشاف بأقصى تنوع
إستراتيجية تهدف إلى تعظيم تنوع المسارات الاستكشافية الجماعية للوكلاء لتغطية فضاء الحالات-الإجراءات بكفاءة. يتم مكافأة الوكلاء لاكتشافهم حالات فريدة مقارنة بتلك التي تم استكشافها بالفعل من قبل المجموعة.
الاستكشاف بالتطور المشترك
عملية استكشاف حيث تتطور استراتيجيات الوكلاء في وقت واحد استجابة لبعضها البعض، مما يخلق ديناميكية سباق تسلح استكشافي. تولد هذه الطريقة سلوكيات استكشافية معقدة وقابلة للتكيف.
الاستكشاف بالتكميم المتجهي الديناميكي
طريقة استكشاف تستخدم تكميمًا متجهيًا تكيفيًا لتقسيم فضاء الحالات-الإجراءات المشترك بين الوكلاء بشكل مستمر. يستكشف الوكلاء المناطق ذات الكثافة المنخفضة لتحسين تغطية الفضاء.