التعلم بالمجموعات النموذجية - مسرد الذكاء الاصطناعي

📖

المصطلحات

مجموعة النماذج

نهج يتضمن تدريب نماذج تنبؤ متعددة في وقت واحد لدمج تنبؤاتها وتقليل خطأ التعميم. تتيح هذه التقنية تحسين المتانة وتقدير عدم اليقين المعرفي في أنظمة التعلم المعزز.

📖

المصطلحات

طريقة أخذ عينات مع الاستبدال تستخدم لإنشاء مجموعات بيانات تدريبية متنوعة، مما يسمح بتدريب نماذج متعددة على مجموعات فرعية مختلفة لالتقاط تباين التنبؤات. فعالة بشكل خاص لتقدير عدم اليقين في التعلم المعزز القائم على النموذج.

📖

المصطلحات

التنبؤ بالمجموعة

تقنية تجمع تنبؤات عدة نماذج تشكل مجموعة، عادة عن طريق المتوسط أو التصويت، للحصول على تنبؤ نهائي أكثر استقرارًا ودقة. التباين بين التنبؤات الفردية يقيس عدم اليقين في النموذج.

📖

المصطلحات

متانة القرار

قدرة الوكيل على الحفاظ على أداء مقبول في مواجهة عدم اليقين في النموذج وتغيرات البيئة، باستخدام المجموعات لتقييم الثقة في القرارات. حاسمة لنشر وكلاء التعلم المعزز في البيئات الواقعية.

📖

المصطلحات

متوسط المجموعة

طريقة تجميع حيث يكون التنبؤ النهائي هو متوسط التنبؤات الفردية لكل نموذج في المجموعة، مما يقلل من التحيز والتباين مع توفير مقياس طبيعي لعدم اليقين. أساس نهج المجموعات الحديثة في التعلم المعزز.

📖

المصطلحات

وزن عدم اليقين

استراتيجية تستخدم عدم اليقين المقدر بالمجموعات لترجيح القرارات، مما يفضل الإجراءات ذات التنبؤات الأكثر يقينًا خلال الاستغلال واستكشاف المناطق ذات عدم اليقين العالي. تحسن التوازن بين الاستكشاف والاستغلال في التعلم المعزز.

📖

المصطلحات

الاستكشاف الموجه بعدم اليقين

سياسة استكشاف تستخدم مقاييس عدم اليقين للمجموعات لتوجيه الوكيل نحو حالات غير معروفة، مما يحسن جمع المعلومات لتحسين تعلم النموذج. بديل فعال لطرق الاستكشاف القائمة على الفضول.

📖

المصطلحات

البيزي التقريبي

تقريب للاستدلال البيزي الدقيق باستخدام مجموعات من الشبكات العصبية لتقدير التوزيع اللاحق لمعلمات النموذج. يوفر تفسيرًا احتماليًا عمليًا لتكميم عدم اليقين في التعلم المعزز.

📖

المصطلحات

عدم اليقين العشوائي

عدم اليقين الكامن في العملية، والذي لا يمكن تقليله حتى مع البيانات اللانهائية، والناتج عن الضوضاء العشوائية في البيئة أو الملاحظات. يتميز عن عدم اليقين المعرفي في أساليب التكميم الحديثة.

📖

المصطلحات

تباين المجموعة

مقياس يكمّن تشتت التنبؤات بين النماذج المختلفة في المجموعة، ويخدم كبديل مباشر لعدم اليقين المعرفي في أنظمة التعلم بالتعزيز القائمة على النموذج (Model-Based RL). يكون أعلى في المناطق الأقل استكشافًا في فضاء الحالات.

📖

المصطلحات

التوزيع اللاحق التنبؤي

توزيع كامل على الحالات أو المكافآت المستقبلية، يدمج عدم اليقين بشأن معلمات النموذج وضجيج العملية في آن واحد. يتم تقريبه في الممارسة من خلال تنبؤات المجموعة. وهو أساسي للتخطيط القوي في التعلم بالتعزيز (RL).

📖

المصطلحات

الكفاءة العينية

مقياس لقدرة الخوارزمية على التعلم بأقل تفاعل ممكن مع البيئة، ويتم تحسينه من خلال المجموعات التي تتيح نقلًا فعالًا للمعرفة واستكشافًا مستهدفًا. أمر بالغ الأهمية لتطبيقات التعلم بالتعزيز (RL) التي تكون مكلفة من حيث البيانات.

📖

المصطلحات

التعميم بالمجموعة

قدرة طرق المجموعة على التعميم بشكل أفضل للحالات غير المرئية من خلال دمج معرفة عدة نماذج صحيحة جزئيًا، مما يقلل من فرط التدريب ويحسن المتانة في مواجهة تقلبات التوزيع.

📖

المصطلحات

فائقة معلمات المجموعة

معلمات تتحكم في تكوين المجموعة، وتشمل عدد النماذج، ومعدلات التمهيد (bootstrap)، وطرق التجميع، واستراتيجيات التنويع. وهي حيوية لتحقيق التوازن الأمثل بين الأداء والتعقيد الحسابي.

قاموس الذكاء الاصطناعي

مجموعة النماذج

Bootstrap للمجموعات

التنبؤ بالمجموعة

متانة القرار

متوسط المجموعة

وزن عدم اليقين

الاستكشاف الموجه بعدم اليقين

البيزي التقريبي

عدم اليقين العشوائي

تباين المجموعة

التوزيع اللاحق التنبؤي

الكفاءة العينية

التعميم بالمجموعة

فائقة معلمات المجموعة

لم يتم العثور على نتائج