बहु-उद्देश्य Q-लर्निंग
नीति स्थान अनुकूलन
सीखने की समस्या की बहु-उद्देश्य प्रकृति द्वारा प्रस्तुत अतिरिक्त जटिलता को प्रभावी ढंग से प्रबंधित करने के लिए नीति स्थान का गतिशील अनुकूलन।
← पीछेसीखने की समस्या की बहु-उद्देश्य प्रकृति द्वारा प्रस्तुत अतिरिक्त जटिलता को प्रभावी ढंग से प्रबंधित करने के लिए नीति स्थान का गतिशील अनुकूलन।
← पीछे