कारणात्मक प्रबलन सीखना
कारणिक सुदृढ़ीकरण अधिगम
एक अधिगम प्रतिमान जो पर्यावरण में होने वाले परिवर्तनों के सामने सीखी गई नीतियों के सामान्यीकरण और मजबूती में सुधार के लिए आरएल (RL) एल्गोरिदम में कारणिक अनुमान के सिद्धांतों को एकीकृत करता है।
← पीछे