🏠 होम
बेंचमार्क
📊 सभी बेंचमार्क 🦖 डायनासोर v1 🦖 डायनासोर v2 ✅ टू-डू लिस्ट ऐप्स 🎨 रचनात्मक फ्री पेज 🎯 FSACB - अल्टीमेट शोकेस 🌍 अनुवाद बेंचमार्क
मॉडल
🏆 टॉप 10 मॉडल 🆓 मुफ्त मॉडल 📋 सभी मॉडल ⚙️ किलो कोड
संसाधन
💬 प्रॉम्प्ट लाइब्रेरी 📖 एआई शब्दावली 🔗 उपयोगी लिंक

एआई शब्दावली

आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश

179
श्रेणियाँ
1,183
उप-श्रेणियाँ
14,904
शब्द
📖
शब्द

कारणिक सुदृढ़ीकरण अधिगम

एक अधिगम प्रतिमान जो पर्यावरण में होने वाले परिवर्तनों के सामने सीखी गई नीतियों के सामान्यीकरण और मजबूती में सुधार के लिए आरएल (RL) एल्गोरिदम में कारणिक अनुमान के सिद्धांतों को एकीकृत करता है।

📖
शब्द

आरएल में प्रत्यक्ष-विरोधी

यह तर्क है कि यदि एजेंट ने किसी दिए गए अवस्था में एक अलग कार्रवाई की होती, तो क्या होता, जो कारणिक रूप से जटिल वातावरणों में मूल्यों के निष्पक्ष अनुमान के लिए आवश्यक है।

📖
शब्द

निर्देशित अचक्रीय कारणिक ग्राफ

एक ग्राफिक संरचना जो चरों के बीच कारणिक निर्भरता संबंधों का प्रतिनिधित्व करती है, जहां निर्देशित किनारे बिना किसी चक्र के एक चर के दूसरे चर पर प्रत्यक्ष प्रभाव को दर्शाते हैं।

📖
शब्द

संरचनात्मक प्रतिक्रिया फलन

एक गणितीय फलन जो कारणिक मॉडल में किसी चर के अपने प्रत्यक्ष कारणों पर कैसे निर्भर करता है, इसका वर्णन करता है, जिसका उपयोग सुदृढ़ीकरण अधिगम में हस्तक्षेपों के प्रभावों की भविष्यवाणी के लिए किया जाता है।

📖
शब्द

आरएल में भ्रम पूर्वाग्रह

मूल्य अनुमान में वह व्यवस्थित विकृति जो अदृश्य चरों के कारण होती है जो कार्रवाइयों और पुरस्कारों दोनों को प्रभावित करते हैं, जिसे कारणिक दृष्टिकोण सुधारने का प्रयास करता है।

📖
शब्द

प्रत्यक्ष-विरोधी पुरस्कार वितरण

पुरस्कारों की संभाव्यता वितरण जो विभिन्न कार्रवाइयों के तहत प्राप्त होते, जिससे कारणिक वातावरणों में नीति मूल्यों का अधिक सटीक अनुमान लगाया जा सकता है।

📖
शब्द

कारणिक मेटा-अधिगम

एक दृष्टिकोण जो नए वातावरणों में अंतर्निहित कारणिक संरचनाओं की जल्दी से खोज करना सीखता है, ताकि सुदृढ़ीकरण अधिगम नीतियों के त्वरित अनुकूलन में सुविधा हो सके।

📖
शब्द

कारणिक अन्वेषण

एक अन्वेषण रणनीति जो कारणिक संबंधों की सक्रिय रूप से पहचान करती है, बजाय इसके कि केवल तत्काल पुरस्कारों को अधिकतम किया जाए, इसका उद्देश्य वातावरण की संरचना के बारे में प्राप्त जानकारी को अधिकतम करना है।

📖
शब्द

डू-कैलकुलस समीकरण

हस्तक्षेप (do()) वाले व्यंजकों को प्रेक्षणीय संभावनाओं में बदलने की अनुमति देने वाले औपचारिक नियमों का एक सेट, जो कारणीय आरएल में मूल्यों की गणना के लिए आवश्यक है।

📖
शब्द

कारणीय सामान्यीकरण

एक सीखी गई नीति की वह क्षमता जो समान अंतर्निहित कारणीय संरचना साझा करने वाले नए वातावरणों में प्रभावी ढंग से काम करती है, जो कारणीय सुदृढीकरण सीखने का मुख्य उद्देश्य है।

📖
शब्द

कारणीय अदृश्य चर

गैर-प्रेक्षणीय चर जो वातावरण की प्रेक्षित स्थितियों पर कारणीय प्रभाव डालते हैं, और जिनकी पहचान कारणीय आरएल में नीतियों की मजबूती के लिए महत्वपूर्ण है।

📖
शब्द

अंतर-वातावरण हस्तांतरण

स्रोत वातावरण में सीखी गई ज्ञान को सामान्य कारणीय संरचनाओं वाले लक्ष्य वातावरणों में स्थानांतरित करने की प्रक्रिया, जिसे कारणीय मॉडलिंग द्वारा सुविधाजनक बनाया गया है।

📖
शब्द

कारणीय मजबूती

किसी सुदृढीकरण सीखने की नीति का वह गुण जो संक्रमणों की संभाव्यता वितरण में बदलाव के सामने कारणीय संबंधों की समझ के कारण अपना प्रदर्शन बनाए रखता है।

📖
शब्द

कारणीय संबंधात्मक सुदृढीकरण सीखना

कारणीय आरएल का विस्तार उन वातावरणों तक जिनमें इकाइयाँ और संबंध होते हैं, जहाँ कारणीय संरचना में वातावरण की वस्तुओं के बीच संबंधात्मक निर्भरताएँ शामिल होती हैं।

📖
शब्द

पर्ल के सिद्धांत

कारणीय अनुमान के तात्विक आधार जिसमें कारणीय पदानुक्रम, संरचनात्मक मॉडल और डू-कैलकुलस शामिल हैं, जिनका उपयोग आरएल में सामान्यीकरण की समस्याओं को हल करने के लिए किया जाता है।

📖
शब्द

आरएल में कारणीय अनुमान

एजेंट-वातावरण अंतःक्रिया डेटा से कारण और प्रभाव के संबंधों की पहचान करने की प्रक्रिया, जो सीखने में सहसंबंध और कारणता के बीच अंतर करने में सक्षम बनाती है।

🔍

कोई परिणाम नहीं मिला