एआई शब्दावली

आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश

179

श्रेणियाँ

1,183

उप-श्रेणियाँ

14,904

शब्द

📖

शब्द

पुरस्कार आकारन

एजेंट के सीखने की प्रक्रिया को अधिक प्रभावी ढंग से मार्गदर्शित करने के लिए पुरस्कार फ़ंक्शन को संशोधित करने की तकनीक। इसे वांछित समाधान की ओर अभिसरण को तेज़ करते हुए इष्टतमता को बनाए रखना चाहिए।

📖

शब्द

बहु-हस्त बैंडिट

एक सरलीकृत क्रमिक अनुकूलन समस्या जहाँ एजेंट को अज्ञात पुरस्कारों वाले कई विकल्पों में से चयन करना होता है। अनुकूलन के संदर्भों में अन्वेषण-शोषण को समझने के लिए यह मौलिक है।

📖

शब्द

आरएल में मेटा-लर्निंग

एक प्रतिमान जहाँ एजेंट सीखना सीखता है, और नए अनुकूलन कार्यों के लिए त्वरित अनुकूलन क्षमताएँ विकसित करता है। यह रीइन्फोर्समेंट लर्निंग को मेटा-लर्निंग के सिद्धांतों के साथ जोड़ता है।

🔍

एआई शब्दावली

पुरस्कार आकारन

बहु-हस्त बैंडिट

आरएल में मेटा-लर्निंग

कोई परिणाम नहीं मिला