العمليات الغاوسية للتعلم المعزز - مسرد الذكاء الاصطناعي

📖

المصطلحات

دالة التغاير

دالة نواة تحدد التشابه بين النقاط في عملية غاوسية، وتحدد بنية الارتباط وخصائص التنعيم للنموذج.

📖

المصطلحات

GP-MDP

عملية قرار ماركوفية حيث يتم نمذجة المكافآت أو الانتقالات بواسطة عمليات غاوسية، مما يدمج عدم اليقين في صياغة مشكلة التعلم المعزز.

📖

المصطلحات

أخذ عينات طومسون مع عمليات غاوسية

طريقة لأخذ عينات الإجراءات تعتمد على سحوبات من العملية الغاوسية الخلفية، مما يسمح بالاستكشاف الموجه بعدم اليقين.

📖

المصطلحات

GP-SARSA

نسخة من خوارزمية SARSA تستخدم عمليات غاوسية لنمذجة دالة قيمة Q مع عدم اليقين في التعلم المعزز.

📖

المصطلحات

نواة RBF

دالة القاعدة الشعاعية الغاوسية المستخدمة كتغاير في العمليات الغاوسية، مما يضمن استمرارية وقابلية اشتقاق الدوال النموذجية.

📖

المصطلحات

GPQ

دالة Q المقربة بواسطة عملية غاوسية، مما يسمح بتحديد كمية عدم اليقين بشأن تقديرات القيمة في التعلم المعزز.

📖

المصطلحات

GP-PILCO

إطار عمل للتعلم المعزز يستخدم عمليات غاوسية لتعلم ديناميكيات النظام مع انتشار تحليلي لعدم اليقين.

📖

المصطلحات

لص سياقي مع عمليات غاوسية

مشكلة اللص حيث تعتمد المكافآت على سياق، يتم نمذجتها بواسطة عمليات غاوسية لالتقاط عدم اليقين المكاني.

📖

المصطلحات

GP-MCTS

بحث شجرة مونت كارلو باستخدام العمليات الغاوسية لتقييم العقد مع عدم اليقين، مما يحسن البحث في التعلم المعزز (RL).

📖

المصطلحات

GP-MAE

الحد الأقصى اللاحق مع تقدير عدم اليقين باستخدام العمليات الغاوسية لتقدير السياسة في التعلم المعزز.

قاموس الذكاء الاصطناعي

دالة التغاير

GP-MDP

أخذ عينات طومسون مع عمليات غاوسية

GP-SARSA

نواة RBF

GPQ

GP-PILCO

لص سياقي مع عمليات غاوسية

GP-MCTS

GP-MAE

لم يتم العثور على نتائج