एआई शब्दावली
आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश
कल्पना द्वारा सीखना
रिइन्फोर्समेंट लर्निंग तकनीक जहाँ एजेंट आंतरिक मॉडल का उपयोग करके मानसिक रूप से परिदृश्यों का अनुकरण करता है और वास्तविक पर्यावरण के साथ बातचीत किए बिना अनुभव उत्पन्न करता है। यह दृष्टिकोण कार्यों के वास्तविक निष्पादन से पहले उनके कार्य पथों का आभासी रूप से अन्वेषण करके सीखने को तेज़ करने की अनुमति देता है।
मानसिक योजना
संज्ञानात्मक प्रक्रिया जहाँ एजेंट सर्वोत्तम कार्य को निष्पादित करने से पहले विभिन्न कार्य अनुक्रमों का मानसिक रूप से अन्वेषण और मूल्यांकन करता है। यह तकनीक भविष्य के परिणामों का पूर्वानुमान लगाने के लिए आंतरिक मॉडल का उपयोग करती है बिना वास्तविक बातचीत लागत के।
पर्यावरण सिमुलेशन
एजेंट के प्रशिक्षण के लिए अतिरिक्त प्रशिक्षण डेटा बनाने के लिए सीखे गए मॉडल का उपयोग करके पर्यावरण अनुभवों की कृत्रिम रूप से उत्पत्ति। यह विधि एजेंट के प्रशिक्षण के लिए उपलब्ध डेटा को बड़े पैमाने पर बढ़ाने की अनुमति देती है।
एआई का सपना
प्रक्रिया जहाँ एक एआई एजेंट निष्क्रियता अवधि के दौरान अपने सीखने को समेकित करने के लिए काल्पनिक स्थिति अनुक्रमों को उत्पन्न और प्रसंस्कृत करता है। ये अनुकरणित सपने मॉडल की मजबूती को बिना पर्यावरण बातचीत के बेहतर बनाने में मदद करते हैं।
काल्पनिक अनुभव
एजेंट द्वारा मानसिक सिमुलेशन के माध्यम से उत्पन्न डेटा जिसका उपयोग प्रशिक्षण के लिए वास्तविक अनुभवों के पूरक के रूप में किया जाता है। ये सिंथेटिक अनुभव वास्तविक बातचीत के समान संरचना का पालन करते हैं लेकिन आंतरिक मॉडल द्वारा उत्पादित होते हैं।
काल्पनिक पथ
पर्यावरण के अपने आंतरिक मॉडल का उपयोग करके एजेंट द्वारा अनुकरणित स्थिति-कार्य-पुरस्कार अनुक्रम। ये आभासी पथ बिना किसी जोखिम या वास्तविक लागत के वैकल्पिक नीतियों का अन्वेषण करने की अनुमति देते हैं।
कल्पना बफर
मेमोरी स्पेस जो कल्पना द्वारा उत्पन्न अनुभवों को एजेंट के भविष्य के प्रशिक्षण के लिए संग्रहीत करता है। यह बफर प्रशिक्षण कॉर्पस को समृद्ध करने के लिए वास्तविक अनुभव बफर के समानांतर काम करता है।
अंतर्निहित जिज्ञासा
आंतरिक प्रेरणा तंत्र जो एजेंट को पर्यावरण मॉडल में अज्ञात या अप्रत्याशित स्थितियों का अन्वेषण करने के लिए प्रेरित करता है। यह जिज्ञासा मॉडल में सुधार के लिए सूचनात्मक परिदृश्यों की ओर कल्पना का मार्गदर्शन करती है।
मॉडल-गाइडेड एक्सप्लोरेशन
आंतरिक मॉडल की भविष्यवाणियों का उपयोग करके सबसे आशाजनक क्रियाओं को पहचानने के लिए खोज रणनीति। एजेंट उन सिमुलेशनों को प्राथमिकता देता है जो उच्च अनिश्चितता या उच्च पुरस्कार क्षमता वाले राज्यों की ओर ले जाते हैं।
वर्चुअल ट्रायल एंड एरर लर्निंग
नीति में सुधार की प्रक्रिया जहां एजेंट वास्तविक इंटरैक्शन के बिना उनके परिणामों से सीखने के लिए सिमुलेशन में क्रियाओं का परीक्षण करता है। यह विधि भौतिक खोज से जुड़ी लागत और जोखिमों को दूर करती है।
भविष्य की स्थिति की भविष्यवाणी
आंतरिक मॉडल की कई समय चरणों पर वातावरण की भविष्य की स्थितियों की पूर्वानुमान करने की क्षमता। यह बहु-चरण भविष्यवाणी प्रभावी कल्पनाशील योजना के लिए आवश्यक है।
पर्यावरणीय गतिशीलता
सीखने के वातावरण में स्थितियों के बीच संक्रमण को नियंत्रित करने वाले नियमों का गणितीय मॉडलिंग। इस गतिशीलता की सटीक समझ यथार्थवादी कल्पनाशील सिमुलेशन के लिए महत्वपूर्ण है।
काल्पनिक रोलआउट
आंतरिक मॉडल और एक उम्मीदवार नीति का उपयोग करके किसी दिए गए स्थिति से पूर्ण पथ का अनुकरण। काल्पनिक रोलआउट विभिन्न कार्रवाई रणनीतियों की गुणवत्ता का तेजी से मूल्यांकन करने की अनुमति देते हैं।