قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
مجموعة النماذج
نهج يتضمن تدريب نماذج تنبؤ متعددة في وقت واحد لدمج تنبؤاتها وتقليل خطأ التعميم. تتيح هذه التقنية تحسين المتانة وتقدير عدم اليقين المعرفي في أنظمة التعلم المعزز.
Bootstrap للمجموعات
طريقة أخذ عينات مع الاستبدال تستخدم لإنشاء مجموعات بيانات تدريبية متنوعة، مما يسمح بتدريب نماذج متعددة على مجموعات فرعية مختلفة لالتقاط تباين التنبؤات. فعالة بشكل خاص لتقدير عدم اليقين في التعلم المعزز القائم على النموذج.
التنبؤ بالمجموعة
تقنية تجمع تنبؤات عدة نماذج تشكل مجموعة، عادة عن طريق المتوسط أو التصويت، للحصول على تنبؤ نهائي أكثر استقرارًا ودقة. التباين بين التنبؤات الفردية يقيس عدم اليقين في النموذج.
متانة القرار
قدرة الوكيل على الحفاظ على أداء مقبول في مواجهة عدم اليقين في النموذج وتغيرات البيئة، باستخدام المجموعات لتقييم الثقة في القرارات. حاسمة لنشر وكلاء التعلم المعزز في البيئات الواقعية.
متوسط المجموعة
طريقة تجميع حيث يكون التنبؤ النهائي هو متوسط التنبؤات الفردية لكل نموذج في المجموعة، مما يقلل من التحيز والتباين مع توفير مقياس طبيعي لعدم اليقين. أساس نهج المجموعات الحديثة في التعلم المعزز.
وزن عدم اليقين
استراتيجية تستخدم عدم اليقين المقدر بالمجموعات لترجيح القرارات، مما يفضل الإجراءات ذات التنبؤات الأكثر يقينًا خلال الاستغلال واستكشاف المناطق ذات عدم اليقين العالي. تحسن التوازن بين الاستكشاف والاستغلال في التعلم المعزز.
الاستكشاف الموجه بعدم اليقين
سياسة استكشاف تستخدم مقاييس عدم اليقين للمجموعات لتوجيه الوكيل نحو حالات غير معروفة، مما يحسن جمع المعلومات لتحسين تعلم النموذج. بديل فعال لطرق الاستكشاف القائمة على الفضول.
البيزي التقريبي
تقريب للاستدلال البيزي الدقيق باستخدام مجموعات من الشبكات العصبية لتقدير التوزيع اللاحق لمعلمات النموذج. يوفر تفسيرًا احتماليًا عمليًا لتكميم عدم اليقين في التعلم المعزز.
عدم اليقين العشوائي
عدم اليقين الكامن في العملية، والذي لا يمكن تقليله حتى مع البيانات اللانهائية، والناتج عن الضوضاء العشوائية في البيئة أو الملاحظات. يتميز عن عدم اليقين المعرفي في أساليب التكميم الحديثة.
تباين المجموعة
مقياس يكمّن تشتت التنبؤات بين النماذج المختلفة في المجموعة، ويخدم كبديل مباشر لعدم اليقين المعرفي في أنظمة التعلم بالتعزيز القائمة على النموذج (Model-Based RL). يكون أعلى في المناطق الأقل استكشافًا في فضاء الحالات.
التوزيع اللاحق التنبؤي
توزيع كامل على الحالات أو المكافآت المستقبلية، يدمج عدم اليقين بشأن معلمات النموذج وضجيج العملية في آن واحد. يتم تقريبه في الممارسة من خلال تنبؤات المجموعة. وهو أساسي للتخطيط القوي في التعلم بالتعزيز (RL).
الكفاءة العينية
مقياس لقدرة الخوارزمية على التعلم بأقل تفاعل ممكن مع البيئة، ويتم تحسينه من خلال المجموعات التي تتيح نقلًا فعالًا للمعرفة واستكشافًا مستهدفًا. أمر بالغ الأهمية لتطبيقات التعلم بالتعزيز (RL) التي تكون مكلفة من حيث البيانات.
التعميم بالمجموعة
قدرة طرق المجموعة على التعميم بشكل أفضل للحالات غير المرئية من خلال دمج معرفة عدة نماذج صحيحة جزئيًا، مما يقلل من فرط التدريب ويحسن المتانة في مواجهة تقلبات التوزيع.
فائقة معلمات المجموعة
معلمات تتحكم في تكوين المجموعة، وتشمل عدد النماذج، ومعدلات التمهيد (bootstrap)، وطرق التجميع، واستراتيجيات التنويع. وهي حيوية لتحقيق التوازن الأمثل بين الأداء والتعقيد الحسابي.