تعلم تعزيز التوزيعي
دالة التوزيع التراكمي
دالة رياضية تعطي احتمال أن يأخذ متغير عشوائي قيمة أقل من أو تساوي عتبة معينة. في التعلم المعزز التوزيعي (distributional RL)، تمثل التوزيع الكامل للعوائد التراكمية.
← رجوع