एआई शब्दावली
आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश
नामित संस्थाओं की पहचान
एक असंरचित पाठ में पूर्वनिर्धारित संस्थाओं जैसे कि व्यक्तियों, संगठनों, स्थानों या तिथियों की स्वचालित पहचान और वर्गीकरण की प्रक्रिया। यह मौलिक तकनीक जानकारी को संरचित करने के लिए उसके विश्लेषण और उपयोग को आसान बनाती है।
संबंध निष्कर्षण
एक पाठ में विभिन्न नामित संस्थाओं के बीच अर्थपूर्ण संबंधों की स्वचालित पहचान, जिससे संरचित ज्ञान ग्राफ बनाने में मदद मिलती है। यह तकनीक निकाली गई जानकारियों के बीच तार्किक कनेक्शनों को समझने पर केंद्रित है।
पाठ वर्गीकरण
एक पाठ को उसके अर्थपूर्ण सामग्री के आधार पर एक या अधिक पूर्वनिर्धारित श्रेणियों में स्वचालित रूप से असाइन करने की प्रक्रिया। यह तकनीक बड़ी मात्रा में डेटा को प्रभावी ढंग से व्यवस्थित और फ़िल्टर करने के लिए पर्यवेक्षित लर्निंग एल्गोरिदम का उपयोग करती है।
विशेषता निष्कर्षण
किसी पाठ में नामित संस्था से जुड़ी विशिष्ट विशेषताओं या गुणों की स्वचालित पहचान। यह तकनीक निकाली गई संस्थाओं को विस्तृत और संदर्भित जानकारी के साथ समृद्ध करने की अनुमति देती है।
समय-संबंधी संस्थाओं की पहचान
किसी पाठ में तिथियों, समय, अवधि और अवधियों जैसे समय-संबंधी अभिव्यक्तियों की पहचान और सामान्यीकरण की प्रक्रिया। यह तकनीक घटनाओं की कालक्रम और उनके समय संदर्भ को समझने के लिए आवश्यक है।
घटना निष्कर्षण
विशिष्ट कार्यों द्वारा ट्रिगर की गई घटनाओं की स्वचालित पहचान और उनके प्रतिभागियों, समय और स्थानों का निष्कर्षण। यह तकनीक गतिशील जानकारी को संरचित करने और पाठ में वर्णित जटिल परिदृश्यों को समझने की अनुमति देती है।
तथ्य निष्कर्षण
किसी पाठ में सत्य के रूप में प्रस्तुत की गई सत्यापन योग्य तथ्यात्मक दावों की स्वचालित पहचान की प्रक्रिया। यह तकनीक विश्वसनीय ज्ञान आधार बनाने के लिए वस्तुनिष्ठ और संरचित जानकारी निकालने पर केंद्रित है।
भावना विश्लेषण
किसी पाठ में व्यक्त की गई राय, भावनाओं और दृष्टिकोणों की स्वचालित पहचान, जिन्हें आमतौर पर सकारात्मक, नकारात्मक या तटस्थ के रूप में वर्गीकृत किया जाता है। यह तकनीक डेटा में व्यक्तिपरकता और मानव दृष्टिकोण को समझने में सक्षम बनाती है।
कीवर्ड निष्कर्षण
दस्तावेज़ या कॉर्पस में सबसे प्रतिनिधि और प्रासंगिक शब्दों की स्वचालित पहचान की प्रक्रिया। यह तकनीक मुख्य सामग्री को जल्दी से सारांशित करने और जानकारी की अनुक्रमणिका और खोज को सुविधाजनक बनाने की अनुमति देती है।
स्वचालित टेक्स्ट सारांश
मुख्य जानकारी और समग्र अर्थ को संरक्षित करते हुए एक पाठ का संक्षिप्त संस्करण स्वचालित रूप से बनाना। यह तकनीक सुसंगत और प्रासंगिक सारांश बनाने के लिए निष्कर्षण या अमूर्त विधियों का उपयोग करती है।
टर्मिनोलॉजी निष्कर्षण
विशेषज्ञता वाले पाठ कॉर्पस में किसी विशिष्ट क्षेत्र से संबंधित तकनीकी शब्दों और विशिष्ट अभिव्यक्तियों की स्वचालित पहचान। यह तकनीक शब्दकोश बनाने और किसी विशेष क्षेत्र के विशेषज्ञ शब्दावली को समझने में मदद करती है।
पैटर्न निष्कर्षण
विशिष्ट प्रकार की जानकारी का संकेत देने वाली पुनरावृत्ति होने वाली भाषाई संरचनाओं या वाक्यविन्यास पैटर्न की स्वचालित पहचान। यह तकनीक समान जानकारी निष्कर्षण का मार्गदर्शन करने के लिए निहित नियमों की खोज करने की अनुमति देती है।
निष्कर्षण द्वारा सीखना
मशीन लर्निंग की एक पद्धति जिसमें मॉडल को बड़े अनलेबल कॉर्पस से स्वचालित रूप से निकाली गई जानकारी का उपयोग करके प्रशिक्षित किया जाता है। यह दृष्टिकोण मैनुअल रूप से एनोटेट डेटा पर निर्भरता को कम करने की अनुमति देता है।
शब्दार्थ एनोटेशन
पाठ के खंडों को औपचारिक अवधारणाओं से जोड़कर संरचित शब्दार्थ मेटाडेटा के साथ पाठ को स्वचालित रूप से समृद्ध करने की प्रक्रिया। यह तकनीक पाठ सामग्री को मौजूदा ज्ञान आधारों के साथ आपस में जोड़ने की अनुमति देती है।
ज्ञान निष्कर्षण
असंरचित पाठ डेटा से ज्ञान की खोज और स्वचालित रूप से संरचना बनाने की समग्र प्रक्रिया। यह तकनीक उपयोग योग्य औपचारिक प्रतिनिधित्व बनाने के लिए कई निष्कर्षण विधियों को जोड़ती है।
इकाइयों का मानकीकरण
वर्तनीगत भिन्नताओं और पर्यायवाचियों को दूर करने के लिए निकाली गई इकाइयों को एक नियमित या मानकीकृत रूप में बदलने की प्रक्रिया। यह तकनीक निकाली गई जानकारी की सुसंगतता और एकीकरण सुनिश्चित करती है।
शब्दार्थ अस्पष्टता दूरीकरण
बहुवचनी शब्द के सही अर्थ की पहचान करने की प्रक्रिया, जो टेक्स्ट में उसके उपयोग के संदर्भ पर आधारित होती है। यह तकनीक सटीक और अस्पष्टता रहित सूचना निष्कर्षण के लिए महत्वपूर्ण है।
उम्मीदवार वाक्यांश निष्कर्षण
एक विशिष्ट निष्कर्षण कार्य के लिए प्रासंगिक जानकारी युक्त संभावित पाठ खंडों की स्वचालित पहचान। यह तकनीक सामग्री के गहन विश्लेषण से पहले खोज स्थान को कम करने का लक्ष्य रखती है।
सूचना फ़िल्टरिंग
पूर्वनिर्धारित मानदंडों के अनुसार गैर-प्रासंगिक जानकारी को अस्वीकार करते हुए प्रासंगिक दस्तावेज़ों या खंडों का स्वचालित चयन प्रक्रिया। यह तकनीक विश्लेषण को वास्तव में उपयोगी डेटा पर केंद्रित करने की अनुमति देती है।
दूरस्थ सीखना
एक पर्यवेक्षित सीखने तकनीक जहां प्रशिक्षण लेबल स्वचालित रूप से गैर-लेबल किए गए पाठों के साथ संरचित ज्ञान स्रोतों को संरेखित करके उत्पन्न किए जाते हैं। यह विधि न्यूनतम मानव प्रयास के साथ बड़े प्रशिक्षण डेटासेट बनाने की अनुमति देती है।