التعلم بالتعزيز المحاكي - مسرد الذكاء الاصطناعي

📂

الفئات الفرعية

Behavioral Cloning

Apprentissage supervisé où l'agent imite directement les actions d'experts à partir de démonstrations.

13 المصطلحات

📂

الفئات الفرعية

التعلم المعزز العكسي

يستنتج وظيفة المكافأة المثلى من سلوكيات الخبراء الملاحظة.

6 المصطلحات

📂

الفئات الفرعية

Generative Adversarial Imitation Learning

Utilise des réseaux antagonistes pour discriminer entre les actions de l'agent et celles de l'expert.

12 المصطلحات

📂

الفئات الفرعية

تجميع البيانات (DAgger)

طريقة تكرارية تجمع بيانات خبير جديدة على مسارات الوكيل لتحسين السياسة.

19 المصطلحات

📂

الفئات الفرعية

تعلم المكافأة من خلال التغذية الراجعة البشرية

تعلم المكافآت من التقييمات المقارنة أو النوعية التي يقدمها البشر

14 المصطلحات

📂

الفئات الفرعية

التعلم المعزز دون اتصال

التعلم بالتعزيز باستخدام مجموعات البيانات الثابتة فقط دون التفاعل مع البيئة.

9 المصطلحات

📂

الفئات الفرعية

التعلم بالتقليد القائم على النموذج

يبني نموذجًا ديناميكيًا للبيئة لتسريع التعلم بالتقليد

10 المصطلحات

📂

الفئات الفرعية

التعلم بالتقليد الميتا

يتعلم تقليد المهام الجديدة بسرعة مع عدد قليل من العروض التوضيحية

17 المصطلحات

📂

الفئات الفرعية

التعلم بالتقليد الهرمي

يحلل السلوكيات المعقدة إلى هرمية من المهام الفرعية الأبسط للتقليد.

10 المصطلحات

📂

الفئات الفرعية

التعلم بالتقليد متعدد الوسائط

يتعامل مع عدة حلول صالحة لنفس المهمة عن طريق تعلم التوزيع على الإجراءات.

9 المصطلحات

📂

الفئات الفرعية

تعلم التقليد الذاتي

يقلد الوكيل إجراءاته السابقة الناجحة لتحسين سياسته الحالية

17 المصطلحات

📂

الفئات الفرعية

التعلم بالتقليد المشروط بالهدف

يتعلم سياسة مشروطة بأهداف محددة لإنجاز مهام متنوعة.

15 المصطلحات

📂

الفئات الفرعية

التعلم بالتعزيز المعاكس المنافس

يجمع بين التعلم بالتعزيز المعاكس والتعلم المنافس لتقدير أكثر قوة للمكافآت

12 المصطلحات

📂

الفئات الفرعية

التعلم بالتقليد مع الملاحظات الجزئية

التعلم بالتقليد في بيئات لا يلاحظ فيها الوكيل إلا جزءًا من الحالة.

14 المصطلحات

📂

الفئات الفرعية

التعلم بالتقليد المنهجي

تسلسل تقدمي للعروض بصعوبة متزايدة لتسهيل التعلم

14 المصطلحات

قاموس الذكاء الاصطناعي

Behavioral Cloning

التعلم المعزز العكسي

Generative Adversarial Imitation Learning

تجميع البيانات (DAgger)

تعلم المكافأة من خلال التغذية الراجعة البشرية

التعلم المعزز دون اتصال

التعلم بالتقليد القائم على النموذج

التعلم بالتقليد الميتا

التعلم بالتقليد الهرمي

التعلم بالتقليد متعدد الوسائط

تعلم التقليد الذاتي

التعلم بالتقليد المشروط بالهدف

التعلم بالتعزيز المعاكس المنافس

التعلم بالتقليد مع الملاحظات الجزئية

التعلم بالتقليد المنهجي

لم يتم العثور على نتائج