قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
مشكلة اللصوص متعددي الأذرع الكلاسيكية
مشكلة أساسية حيث يختار الوكيل من بين عدة خيارات لتعظيم المكافأة التراكمية.
خوارزميات إبسيلون-جشعة
استراتيجية تستغل أفضل إجراء معروف باحتمالية 1-إبسيلون وتستكشف عشوائياً باحتمالية إبسيلون.
خوارزميات UCB
طرق تعتمد على الحدود العليا للثقة التي توازن بين الاستكشاف والاستغلال عبر الفواصل الإحصائية.
معاينة طومسون
النهج البيزي الذي يقوم بأخذ عينات من المعلمات بناءً على توزيعها الخلفي لاتخاذ القرارات.
قطاع الطرق السياقية
امتداد حيث القرارات تعتمد على الخصائص السياقية الملاحظة في كل جولة.
اللصوص الخطيون
نماذج حيث المكافأة المتوقعة هي دالة خطية للخصائص السياقية.
اللصوص غير المستقرين
سياق تتغير فيه توزيعات المكافآت بمرور الوقت، مما يتطلب تكيفًا مستمرًا.
اللصوص التوافقية
مشاكل حيث يختار الوكيل مجموعات من الإجراءات في وقت واحد مع قيود هيكلية.
اللصوص المتنافسون
سيناريو يختار فيه الخصم المكافآت لتقليل مكاسب العميل.
اللصوص المتتالية
نموذج يتم فيه عرض العناصر بالتسلسل حتى ينقر المستخدم على أحدها.
اللصوص ذوو التغذية الراجعة المحدودة
الحالات التي يتم فيها ملاحظة معلومات جزئية فقط حول المكافآت بعد كل إجراء.
خوارزميات اللصوص للإعلانات عبر الإنترنت
تطبيق خاص لتحسين الحملات الإعلانية في الوقت الفعلي.
لصوص متعددو الأذرع لاختبارات A/B
بديل ذكي لاختبارات A/B التقليدية لتحسين تجارب الويب.
قطاع الطرق للتوصيات
أنظمة تتعلم تفضيلات المستخدم لتخصيص التوصيات.
اللصوص الهرميون
هياكل متعددة المستويات حيث يتم تنظيم القرارات بشكل هرمي للمشكلات المعقدة.