قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
تغذية راجعة ثنائية
نوع من التغذية الراجعة حيث يتم ملاحظة مؤشر إيجابي/سلبي فقط بعد كل إجراء، دون معلومات حول حجم المكافأة. يحد هذا التنسيق من المعلومات المتاحة لخوارزمية التعلم.
تغذية راجعة مقارنة
معلومات مقارنة بين إجراءين حيث يتم الكشف عن الفائز فقط، مما يخفي القيم المطلقة للمكافآت. يستخدم في أنظمة التوصية حيث يمكن ملاحظة التفضيل النسبي فقط.
تغذية راجعة مشوشة
ملاحظات المكافآت الملوثة بضوضاء عشوائية تقلل من جودة المعلومات المجمعة. قد تنشأ الضوضاء من قياسات غير دقيقة أو سلوكيات مستخدم غير متوقعة.
تغذية راجعة مقيدة
حالة يتم فيها تقييد المكافآت المرصودة عند قيمة قصوى معينة، مما يخفي القيم الحقيقية التي تتجاوز هذا الحد. شائع في الأنظمة ذات القيود التقنية أو التجارية.
تغذية راجعة مبتورة
معلومات جزئية حيث تتوفر فقط معرفة الرتبة أو الموضع النسبي للمكافآت، دون قيمها المطلقة. يستخدم بشكل خاص في أنظمة التصنيف.
الاستكشاف والاستغلال مع تغذية راجعة جزئية
معضلة أساسية حيث يجب على الخوارزمية الموازنة بين اكتشاف إجراءات جديدة واستغلال أفضل الإجراءات المعروفة بمعلومات غير كاملة. تتطلب استراتيجيات قوية لمواجهة عدم اليقين المتزايد.
قطاع الطرق السياقية مع تغذية راجعة محدودة
امتداد لمشكلة قطاع الطرق حيث تعتمد الإجراءات على سياق قابل للملاحظة ولكن بمعلومات جزئية فقط عن المكافآت. تتطلب أساليب تقدير متطورة لإدارة عدم اليقين السياقي.
تقدير توزيع المكافآت
عملية استنتاج التوزيع الأساسي للمكافآت من الملاحظات الجزئية أو المشوشة. أساسي لاتخاذ قرارات مثلى في ظل تغذية راجعة محدودة.
قطاع الطرق التوافيقيون مع تغذية راجعة جزئية
مشكلة يتم فيها اختيار عدة إجراءات في وقت واحد ولكن لا تتوفر سوى معلومات مجمعة عن أدائها. تتطلب خوارزميات تتكيف مع التعقيد التوافقي.
قطاع الطرق الخطي مع الضوضاء
نموذج حيث تتبع المكافآت تركيبة خطية من الميزات ولكن يتم ملاحظتها مع ضوضاء إضافية. يتطلب تقنيات تقدير قوية في مواجهة الاضطرابات.
قطاع الطرق الخصوميون مع تغذية راجعة محدودة
إعداد حيث يمكن للخصم التلاعب بالمكافآت ولكن المراقب لا يحصل إلا على معلومات جزئية حول هذه التلاعبات. يتطلب استراتيجيات تكيفية قوية.
تغذية راجعة مجمعة
معلومات تراكمية حول أداء مجموعة من الإجراءات بدلاً من كل إجراء على حدة. نموذجية للأنظمة ذات قيود القياس أو التكلفة.
تغذية راجعة متأخرة
حالة حيث لا يتم ملاحظة مكافأة الإجراء إلا بعد تأخير كبير، مما يخلق عدم يقين زمني. يعقد إسناد المكافآت إلى الإجراءات المناسبة.
حد الندم مع تغذية راجعة جزئية
تحليل نظري لأقصى أداء يمكن تحقيقه في ظل قيود المعلومات المحدودة. يوفر ضمانات حول فعالية الخوارزميات على الرغم من التغذية الراجعة غير الكاملة.