एआई शब्दावली
आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश
179
श्रेणियाँ
1,183
उप-श्रेणियाँ
14,904
शब्द
शब्द
पुरस्कार आकारन
एजेंट के सीखने की प्रक्रिया को अधिक प्रभावी ढंग से मार्गदर्शित करने के लिए पुरस्कार फ़ंक्शन को संशोधित करने की तकनीक। इसे वांछित समाधान की ओर अभिसरण को तेज़ करते हुए इष्टतमता को बनाए रखना चाहिए।
शब्द
बहु-हस्त बैंडिट
एक सरलीकृत क्रमिक अनुकूलन समस्या जहाँ एजेंट को अज्ञात पुरस्कारों वाले कई विकल्पों में से चयन करना होता है। अनुकूलन के संदर्भों में अन्वेषण-शोषण को समझने के लिए यह मौलिक है।
शब्द
आरएल में मेटा-लर्निंग
एक प्रतिमान जहाँ एजेंट सीखना सीखता है, और नए अनुकूलन कार्यों के लिए त्वरित अनुकूलन क्षमताएँ विकसित करता है। यह रीइन्फोर्समेंट लर्निंग को मेटा-लर्निंग के सिद्धांतों के साथ जोड़ता है।
🔍