संरचनात्मक सुदृढ़ीकरण सीखना
समाप्ति फलन
एक फलन जो निर्धारित करता है कि कोई विकल्प कब रुकना चाहिए और नियंत्रण को उच्च स्तर पर वापस करना चाहिए, जो पदानुक्रमित स्तरों के बीच समय निर्देशन के लिए महत्वपूर्ण है।
← पीछे