قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
التعلم بالتقليد متعدد الوسائط
نموذج تعلم حيث يتعلم الوكيل من عمليات توضيحية تقدم حلولاً صالحة متعددة لنفس المهمة، مما يلخص تنوع سلوكيات الخبراء.
توزيع السياسات متعدد الوسائط
تمثيل احتمالي لسياسة تحتوي على أوضاع مميزة متعددة، كل منها يتوافق مع استراتيجية حل مختلفة لتحقيق نفس الهدف.
وضع العمل
تكوين سلوكي محدد ضمن توزيع متعدد الوسائط، يمثل طريقة مميزة ومتماسكة لتنفيذ مهمة.
تجميع العمليات التوضيحية
عملية الجمع الذكي لمسارات التعلم القادمة من استراتيجيات مختلفة لبناء سياسة موحدة تحافظ على تعدد الوسائط.
مزج التوزيعات الغوسية للسياسات
نموذج معلم يمثل سياسة متعددة الوسائط كترجيح لمجموعة توزيعات غوسية متعددة، كل توزيع غوسي يتوافق مع وضع سلوكي.
اللاحق للمسار
توزيع شرطي على المسارات الممكنة بالنظر للحالة الأولية والهدف، يلخص عدم اليقين حول الطرق المختلفة للوصول إلى الهدف.
الفضاء الكامن السلوكي
تمثيل مضغوط حيث كل نقطة تشفر استراتيجية سلوكية مميزة، مما يسمح بالتنقل والاستكمال بين أوضاع العمل المختلفة.
تجميع العمليات التوضيحية
تقنية التجميع التلقائي للمسارات المماثلة لتحديد وعزل الأوضاع السلوكية المختلفة الموجودة في بيانات التقليد.
فصل الوضعية-الإجراء
بنية يتم فيها التعامل مع اختيار السلوك وتوليد الإجراءات المحددة بواسطة مكونات منفصلة لنمذجة متعددة الأوضاع أفضل.
استدلال الوضع
عملية تحديد السلوك المناسب للاستخدام في موقف معين، بناءً على السياق وتفضيلات الوكيل.
السياسة المشروطة
سياسة تولد إجراءات مشروطة بالحالة الحالية ومعرف الوضع المحدد، مما يسمح بالتحكم الصريح في الاستراتيجية المعتمدة.
اختيار الحل الأمثل
آلية تقوم بتقييم واختيار أفضل حل من بين عدة بدائل صالحة بناءً على معايير مثل الكفاءة، المتانة أو القيود السياقية.
التباين السلوكي
مقياس إحصائي يكمّ تشتت الإجراءات أو المسارات حول كل وضع، مما يميز التباين داخل الوضع عن تعدد الأوضاع.
دمج الأوضاع
تقنية تجمع بين عدة سلوكيات لإنشاء استراتيجيات هجينة جديدة، مستغلة نقاط القوة لكل وضع فردي.
تعلم السياسات الفرعية
نهج يتم فيه نمذجة كل وضع كسياسة فرعية متخصصة، يتم تعلمها بشكل مستقل قبل دمجها في بنية متعددة الأوضاع شاملة.
هرمية الحلول
هيكل تنظيمي للحلول الصالحة المختلفة، غالبًا ما يعتمد على تعقيدها، كفاءتها أو سياق التطبيق الأمثل.
الاستكشاف الموجه بالوضع
استراتيجية استكشاف تحافظ على الاتساق مع النمط السلوكي المحدد مع اكتشاف تغييرات صالحة جديدة داخل هذا النمط.
النقل بين الأوضاع
القدرة على نقل المعرفة المكتسبة في نمط سلوكي لتحسين التعلم أو التنفيذ في نمط آخر مشابه.
التقييم متعدد الأوضاع
مقياس تقييم يأخذ في الاعتبار ليس فقط متوسط الأداء ولكن أيضًا التغطية وجودة الأنماط السلوكية المختلفة التي تم تعلمها.