قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
دالة التغاير
دالة نواة تحدد التشابه بين النقاط في عملية غاوسية، وتحدد بنية الارتباط وخصائص التنعيم للنموذج.
GP-MDP
عملية قرار ماركوفية حيث يتم نمذجة المكافآت أو الانتقالات بواسطة عمليات غاوسية، مما يدمج عدم اليقين في صياغة مشكلة التعلم المعزز.
أخذ عينات طومسون مع عمليات غاوسية
طريقة لأخذ عينات الإجراءات تعتمد على سحوبات من العملية الغاوسية الخلفية، مما يسمح بالاستكشاف الموجه بعدم اليقين.
GP-SARSA
نسخة من خوارزمية SARSA تستخدم عمليات غاوسية لنمذجة دالة قيمة Q مع عدم اليقين في التعلم المعزز.
نواة RBF
دالة القاعدة الشعاعية الغاوسية المستخدمة كتغاير في العمليات الغاوسية، مما يضمن استمرارية وقابلية اشتقاق الدوال النموذجية.
GPQ
دالة Q المقربة بواسطة عملية غاوسية، مما يسمح بتحديد كمية عدم اليقين بشأن تقديرات القيمة في التعلم المعزز.
GP-PILCO
إطار عمل للتعلم المعزز يستخدم عمليات غاوسية لتعلم ديناميكيات النظام مع انتشار تحليلي لعدم اليقين.
لص سياقي مع عمليات غاوسية
مشكلة اللص حيث تعتمد المكافآت على سياق، يتم نمذجتها بواسطة عمليات غاوسية لالتقاط عدم اليقين المكاني.
GP-MCTS
بحث شجرة مونت كارلو باستخدام العمليات الغاوسية لتقييم العقد مع عدم اليقين، مما يحسن البحث في التعلم المعزز (RL).
GP-MAE
الحد الأقصى اللاحق مع تقدير عدم اليقين باستخدام العمليات الغاوسية لتقدير السياسة في التعلم المعزز.