قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
استنساخ السلوك
التعلم المباشر للسياسة عن طريق تقليل الخطأ بين إجراءات الوكيل والعروض الخبيرة
التعلم بالتعزيز العكسي
استنتاج دالة المكافأة من العروض الخبيرة ليتعلم بعد ذلك السياسة المثلى
التعلم بالتقليد التنافسي التوليدي
استخدام الشبكات التنافسية للتمييز بين سلوك الوكيل والعروض الخبيرة
تجميع بيانات DAgger
جمع البيانات بشكل تكراري من خلال استشارة الخبير حول الحالات التي تمت زيارتها بواسطة السياسة الحالية
التعلم بالتقليد بدون اتصال
التعلم من مجموعة ثابتة من العروض التوضيحية بدون تفاصيل إضافية مع البيئة.
التعلم بالمحاكاة على الإنترنت
التعلم المستمر مع التفاعل في الوقت الفعلي والتحديثات المستندة إلى العروض التوضيحية الجديدة.
المحاكاة بالملاحظة
التعلم عن طريق ملاحظة الحالات والمسارات فقط دون الوصول إلى إجراءات الخبير
التعلم بالتقليد الهرمي
تقسيم المهام المعقدة إلى مهام فرعية مع التعلم بالتقليد على مستويات مختلفة من التجريد.
التعلم بالتقليد من لقطة واحدة
القدرة على تقليد مهمة جديدة بعد ملاحظة عرض توضيحي واحد.
التعلم الفوقي بالمحاكاة
التعلم لتعلم مهام جديدة بسرعة عبر المحاكاة من خلال الخبرة في مهام متعددة
التعلم بالتقليد متعدد الوسائط
إدارة العروض التوضيحية مع حلول صالحة متعددة وتعلم السياسات متعددة الوسائط.
التقليد بملاحظات جزئية
التعلم بالتقليد عندما لا تغطي العروض إلا جزئياً مساحة الحالات.