डबल क्यू-लर्निंग
क्रॉस मूल्यांकन
डबल क्यू-लर्निंग का मौलिक सिद्धांत जहां प्रत्येक क्यू अनुमानकर्ता दूसरे द्वारा चुनी गई क्रियाओं का मूल्यांकन करता है, जो एक क्रॉस-सत्यापन बनाता है जो निरंतर अतिमूल्यांकन को रोकता है।
← पीछे