Q-learning مزدوج
التقييم المتقاطع
مبدأ أساسي في التعلم Q المزدوج حيث يقوم كل مقدّر Q بتقييم الإجراءات المحددة بواسطة الآخر، مما يخلق تحققًا متبادلًا يمنع الإفراط المستمر في التقدير.
← رجوعمبدأ أساسي في التعلم Q المزدوج حيث يقوم كل مقدّر Q بتقييم الإجراءات المحددة بواسطة الآخر، مما يخلق تحققًا متبادلًا يمنع الإفراط المستمر في التقدير.
← رجوع