قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
التعلم النشط
نهج شبه خاضع للإشراف حيث يختار الخوارزمية بشكل متكرر الأمثلة الأكثر إفادة للتعليق، مما يحسن كفاءة التكلفة للتعلم.
المفاضلة بين الاستكشاف والاستغلال
معضلة أساسية في التعلم المعزز تتعلق بموازنة الحصول على معلومات جديدة (الاستكشاف) واستخدام المعارف الحالية (الاستغلال).
العينة القائمة على الكثافة
نهج أخذ العينات النشط الذي يأخذ في الاعتبار كل من عدم اليقين وكثافة الأمثلة لتجنب القيم المتطرفة والتركيز على المناطق التمثيلية.
النموذج التنبؤي للأمام
نموذج تنبؤي يقدر الحالة التالية والمكافأة بناءً على الحالة الحالية والإجراء، وهو أساسي للتخطيط في التعلم المعزز.
النموذج العكسي
نموذج يتعلم استنتاج الإجراء الذي أدى إلى انتقال حالة معين، وهو مفيد للتعلم بالاقتداء والفهم السببي.
وحدة التخطيط
مكون خوارزمي يستخدم النموذج المتعلم لمحاكاة مسارات مستقبلية وتحسين السياسات قبل التنفيذ الفعلي.
الاستكشاف النشط
استراتيجية استكشاف مقصودة تختار بفعالية الإجراءات التي تزيد من المعلومات المكتسبة عن البيئة أو السياسة.