गहरा निर्धारक नीति ढाल (DDPG)
ओर्नस्टाइन-उहलेनबेक प्रक्रिया
क्रियाओं में समय के साथ सहसंबंधित शोर उत्पन्न करने के लिए उपयोग किया जाने वाला एक स्टोकास्टिक प्रक्रिया, जो निरंतर स्थानों में प्रभावी अन्वेषण को बढ़ावा देता है।
← पीछे