التعلم بالمحاكاة - مسرد الذكاء الاصطناعي

📂

الفئات الفرعية

استنساخ السلوك

التعلم المباشر للسياسة عن طريق تقليل الخطأ بين إجراءات الوكيل والعروض الخبيرة

17 المصطلحات

📂

الفئات الفرعية

التعلم بالتعزيز العكسي

استنتاج دالة المكافأة من العروض الخبيرة ليتعلم بعد ذلك السياسة المثلى

14 المصطلحات

📂

الفئات الفرعية

التعلم بالتقليد التنافسي التوليدي

استخدام الشبكات التنافسية للتمييز بين سلوك الوكيل والعروض الخبيرة

18 المصطلحات

📂

الفئات الفرعية

تجميع بيانات DAgger

جمع البيانات بشكل تكراري من خلال استشارة الخبير حول الحالات التي تمت زيارتها بواسطة السياسة الحالية

17 المصطلحات

📂

الفئات الفرعية

التعلم بالتقليد بدون اتصال

التعلم من مجموعة ثابتة من العروض التوضيحية بدون تفاصيل إضافية مع البيئة.

13 المصطلحات

📂

الفئات الفرعية

التعلم بالمحاكاة على الإنترنت

التعلم المستمر مع التفاعل في الوقت الفعلي والتحديثات المستندة إلى العروض التوضيحية الجديدة.

15 المصطلحات

📂

الفئات الفرعية

المحاكاة بالملاحظة

التعلم عن طريق ملاحظة الحالات والمسارات فقط دون الوصول إلى إجراءات الخبير

15 المصطلحات

📂

الفئات الفرعية

التعلم بالتقليد الهرمي

تقسيم المهام المعقدة إلى مهام فرعية مع التعلم بالتقليد على مستويات مختلفة من التجريد.

17 المصطلحات

📂

الفئات الفرعية

التعلم بالتقليد من لقطة واحدة

القدرة على تقليد مهمة جديدة بعد ملاحظة عرض توضيحي واحد.

11 المصطلحات

📂

الفئات الفرعية

التعلم الفوقي بالمحاكاة

التعلم لتعلم مهام جديدة بسرعة عبر المحاكاة من خلال الخبرة في مهام متعددة

20 المصطلحات

📂

الفئات الفرعية

التعلم بالتقليد متعدد الوسائط

إدارة العروض التوضيحية مع حلول صالحة متعددة وتعلم السياسات متعددة الوسائط.

19 المصطلحات

📂

الفئات الفرعية

التقليد بملاحظات جزئية

التعلم بالتقليد عندما لا تغطي العروض إلا جزئياً مساحة الحالات.

10 المصطلحات

قاموس الذكاء الاصطناعي

استنساخ السلوك

التعلم بالتعزيز العكسي

التعلم بالتقليد التنافسي التوليدي

تجميع بيانات DAgger

التعلم بالتقليد بدون اتصال

التعلم بالمحاكاة على الإنترنت

المحاكاة بالملاحظة

التعلم بالتقليد الهرمي

التعلم بالتقليد من لقطة واحدة

التعلم الفوقي بالمحاكاة

التعلم بالتقليد متعدد الوسائط

التقليد بملاحظات جزئية

لم يتم العثور على نتائج