قاموس الذكاء الاصطناعي

القاموس الكامل للذكاء الاصطناعي

227

الفئات

2,955

الفئات الفرعية

34,512

المصطلحات

نهج شبه خاضع للإشراف حيث يختار الخوارزمية بشكل متكرر الأمثلة الأكثر إفادة للتعليق، مما يحسن كفاءة التكلفة للتعلم.

معضلة أساسية في التعلم المعزز تتعلق بموازنة الحصول على معلومات جديدة (الاستكشاف) واستخدام المعارف الحالية (الاستغلال).

نهج أخذ العينات النشط الذي يأخذ في الاعتبار كل من عدم اليقين وكثافة الأمثلة لتجنب القيم المتطرفة والتركيز على المناطق التمثيلية.

نموذج تنبؤي يقدر الحالة التالية والمكافأة بناءً على الحالة الحالية والإجراء، وهو أساسي للتخطيط في التعلم المعزز.

نموذج يتعلم استنتاج الإجراء الذي أدى إلى انتقال حالة معين، وهو مفيد للتعلم بالاقتداء والفهم السببي.

مكون خوارزمي يستخدم النموذج المتعلم لمحاكاة مسارات مستقبلية وتحسين السياسات قبل التنفيذ الفعلي.

استراتيجية استكشاف مقصودة تختار بفعالية الإجراءات التي تزيد من المعلومات المكتسبة عن البيئة أو السياسة.

🔍