एआई शब्दावली
आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश
डायना-क्यू द्वारा सीखना
सीधे सीखने और योजना बनाने को जोड़ने वाला हाइब्रिड एल्गोरिथ्म जो सिमुलेटेड अनुभवों को उत्पन्न करने के लिए सीखे हुए मॉडल का उपयोग करता है।
मोंटे कार्लो ट्री सर्च योजना
एक निर्णय पेड़ खोज एल्गोरिथ्म जो मॉडल वातावरण में भविष्य की कार्रवाइयों का मूल्यांकन करने के लिए यादृच्छिक सिमुलेशन का उपयोग करता है।
कल्पना द्वारा सीख
आंतरिक मॉडल का उपयोग करके मानसिक रूप से परिदृश्यों का अनुकरण करने और वास्तविक अंतःक्रिया के बिना सीखने को तेज करने की तकनीक।
विश्व मॉडल्स
पर्यावरण का एक संकुचित प्रतिनिधित्व और एक अंतरिक्षीय स्थान में योजना बनाने के लिए एक संक्रमण मॉडल सीखने वाली आर्किटेक्चर।
मॉडल समूह द्वारा सीखना
अनिश्चितता का मापन करने और निर्णयों की मजबूती में सुधार करने के लिए कई सीखे हुए मॉडलों का उपयोग करने वाला दृष्टिकोण।
मॉडल अंतरीकरण द्वारा सीखना
पर्यावरण के अंतरीक्ष योग्य मॉडल के माध्यम से ग्रेडियेंट्स को पारित करके सीधे नीतियों को अनुकूलित करने की विधि।
मॉडल-आधारित जिज्ञासा अधिगम
मॉडल की पूर्वानुमान त्रुटियों को आंतरिक संकेत के रूप में उपयोग करके पर्यावरण के अन्वेषण का मार्गदर्शन करने वाली प्रणाली।
मॉडल-आधारित पदानुक्रम सीखना
लंबे समय क्षितिज पर प्रभावी योजना बनाने के लिए विभिन्न समय-पैमानों पर मॉडल को जोड़ते हुए बहु-स्तरीय संरचना।
प्रक्षेपवक्र भविष्यवाणी द्वारा सीखना
भविष्यवाणी मॉडल जो क्रियान्वयन से पहले क्रियाओं के परिणामों का मूल्यांकन करने के लिए भविष्य की स्थिति अनुक्रमों की पूर्वानुमान लगाना सीखते हैं।
मॉडल-आधारित ट्रांसफर लर्निंद्वारा सीखना
नए कार्यों के लिए अनुकूलन को तेज़ करने के लिए समान वातावरणों के बीच मॉडल के ज्ञान को हस्तांतरित करने की तकनीक।
MuZero
उन्नत एल्गोरिदम जो एक साथ ट्रांज़िशन मॉडल, प्रतिक्रिया और मूल्य का मॉडल गतिशीलता के पूर्व ज्ञान के बिना सीखता है।
सक्रिय अधिगम द्वारा अधिगम
मॉडल की अधिगम दक्षता में सुधार के लिए सबसे अधिक सूचनात्मक अनुभवों को सक्रिय रूप से चुनने की रणनीति।