🏠 الرئيسية
المقاييس
📊 جميع المقاييس 🦖 ديناصور v1 🦖 ديناصور v2 ✅ تطبيقات قائمة المهام 🎨 صفحات حرة إبداعية 🎯 FSACB - العرض النهائي 🌍 مقياس الترجمة
النماذج
🏆 أفضل 10 نماذج 🆓 نماذج مجانية 📋 جميع النماذج ⚙️ كيلو كود
الموارد
💬 مكتبة الأوامر 📖 قاموس الذكاء الاصطناعي 🔗 روابط مفيدة

قاموس الذكاء الاصطناعي

القاموس الكامل للذكاء الاصطناعي

227
الفئات
2,955
الفئات الفرعية
34,512
المصطلحات
📖
المصطلحات

دالة المكافأة المتجهة

دالة عائد ترجع متجهًا من المكافآت بدلاً من قيمة واحدة، مما يسمح بالتقاط أهداف متعددة ومتعارضة في نفس الوقت في التعلم المعزز.

📖
المصطلحات

تحسين السياسة متعدد الأهداف

عملية تحسين سياسات متعددة أو سياسة واحدة بهدف تحسين دوال قيمة متعددة تتوافق مع أهداف مختلفة.

📖
المصطلحات

التعلم المعزز مع فضاء الإجراءات المستمر

نموذج في التعلم المعزز حيث يمكن للوكيل الاختيار من عدد لا نهائي من الإجراءات المستمرة، مما يتطلب خوارزميات تحسين مناسبة مثل PPO أو SAC.

📖
المصطلحات

التعلم المعزز القائم على التفضيلات

نهج يتم فيه دمج تفضيلات الإنسان حول الموازنة بين الأهداف في عملية التعلم لتوجيه الوكيل نحو حلول مرغوبة في جبهة باريتو.

📖
المصطلحات

جبهة باريتو المحدبة

جبهة باريتو ذات محدبة رياضية، مما يسمح باستخدام طرق التحويل الخطي للعثور على جميع الحلول المثلى.

📖
المصطلحات

طريقة المجموع الموزون

تقنية تحويل تقوم بوزن كل هدف بمعامل لإنشاء دالة هدف قياسية، بسيطة ولكنها محدودة لجبهات باريتو المحدبة.

📖
المصطلحات

تحويل تشيبيشيف

طريقة تحويل تستخدم norme تشيبيشيف لضمان اكتشاف حلول باريتو-مثلى حتى على الجبهات غير المحدبة.

📖
المصطلحات

توازن ناش في التعلم المعزز متعدد الأهداف

نقطة توازن لا يمكن فيها لأي وكيل تحسين موقفه عن طريق تعديل استراتيجيته بشكل أحادي، مطبقة على الألعاب متعددة الأهداف مع إجراءات مستمرة.

📖
المصطلحات

الترجيح الديناميكي

استراتيجية تكيفية تعدل أوزان الأهداف خلال التعلم لاستكشاف جبهة باريتو بكفاءة وتجنب النهايات المثلى المحلية.

📖
المصطلحات

الحلول غير المهيمنة

مجموعة من الحلول حيث لا يوجد حل أفضل بشكل صارم من حل آخر على جميع الأهداف، مما يشكل مجموعة الحلول المثلى باريتو.

📖
المصطلحات

الترتيب المعجمي

نهج هرمي يتم فيه تحسين الأهداف بشكل متسلسل حسب أولويتها المطلقة، دون مساومة بين أهداف مختلفة الرتبة.

📖
المصطلحات

السياسات متعددة الأهداف العشوائية

سياسات احتمالية في مساحات الإجراء المستمرة تحسن عدة أهداف في وقت واحد، غالباً ما يتم تطبيقها كتوزيعات غاوسية معلمية.

📖
المصطلحات

تحسين باريتو المستمر

تحسين مستمر لجبهة باريتو خلال التعلم، مما يسمح للعامل بتكييف مساوماته بين الأهداف بشكل ديناميكي.

📖
المصطلحات

الممثل-الناقد متعدد الأهداف

بنية خوارزمية تجمع بين الممثل والناقد المكيّفين لمشاكل متعددة الأهداف، مع دوال قيم متجهة وسياسات متعددة الأهداف.

📖
المصطلحات

تحلل مساحة الإجراء

تقنية تقسم مساحة الإجراء المستمرة إلى مساحات فرعية متخصصة لكل هدف، مما يسهل التحسين متعدد الأهداف في البيئات المعقدة.

📖
المصطلحات

الاستكشاف-الاستغلال متعدد الأهداف

معضلة ممتدة لمشاكل متعددة الأهداف حيث يجب أن يهدف الاستكشاف إلى اكتشاف مساومات مثلى متنوعة بدلاً من حل مثلي واحد.

🔍

لم يتم العثور على نتائج