रीइन्फोर्समेंट लर्निंग फॉर ऑप्टिमाइज़ेशन
नीति निर्णय
रणनीति या मानचित्रण जो संभावित प्रत्येक स्थिति में किए जाने वाले कार्य को परिभाषित करता है, सुदृढीकरण सीखने की प्रक्रिया में एजेंट के व्यवहार का प्रतिनिधित्व करता है।
← पीछे