التعلم الزمني التفاضلي
TD(λ)
خوارزمية تعلم زمني تفاضلي معممة تستخدم معلمة λ لوزن عوائد الخطوات-n وآثار الأهلية، مما يسمح بتوازن بين TD(0) ومونت كارلو.
← رجوعخوارزمية تعلم زمني تفاضلي معممة تستخدم معلمة λ لوزن عوائد الخطوات-n وآثار الأهلية، مما يسمح بتوازن بين TD(0) ومونت كارلو.
← رجوع