एआई शब्दावली
आर्टिफिशियल इंटेलिजेंस का पूर्ण शब्दकोश
हाइब्रिड रिट्रीवल
RAG सिस्टम में सटीकता और रिकॉल को एक साथ अनुकूलित करने के लिए वेक्टर और कीवर्ड खोज विधियों को संयोजित करने वाली खोज दृष्टिकोण। यह तकनीक अधिक व्यापक परिणामों के लिए सिमेंटिक खोज और लेक्सिकल खोज की ताकत का उपयोग करती है।
वेक्टर सर्च
उच्च-आयामी बहुआयामी स्थान में वेक्टर एम्बेडिंग की सिमेंटिक समानता पर आधारित खोज विधि। संदर्भ की समझ के माध्यम से सटीक कीवर्ड मिलान के बिना भी प्रासंगिक दस्तावेज़ ढूंढने की अनुमति देती है।
कीवर्ड सर्च
दस्तावेज़ों और क्वेरी में शब्दों के सटीक या आंशिक मिलान पर आधारित पारंपरिक खोज तकनीक। शब्दों की आवृत्ति और वितरण के आधार पर प्रासंगिकता का मूल्यांकन करने के लिए BM25 जैसे एल्गोरिदम का उपयोग करती है।
स्पार्स रिट्रीवल
विशिष्ट शब्दों की उपस्थिति या अनुपस्थिति पर आधारित टेक्स्ट की विरल प्रस्तुतियों का उपयोग करने वाली खोज विधि। गणना के मामले में अधिक कुशल और सटीक कीवर्ड मिलान के लिए उत्कृष्ट।
रिसिप्रोकल रैंक फ्यूजन
हार्मोनिक वेटिंग फॉर्मूला का उपयोग करके कई खोज प्रणालियों की रैंकिंग को संयोजित करने वाला खोज परिणाम फ्यूजन एल्गोरिदम। दृष्टिकोणों की पूरकता का उपयोग करके मजबूत रैंकिंग प्राप्त करने की अनुमति देता है।
BM25 एल्गोरिदम
शब्दों की आवृत्ति और दस्तावेज़ों की लंबाई पर आधारित संभाव्य रैंकिंग एल्गोरिदम, कीवर्ड खोज इंजन में व्यापक रूप से उपयोग किया जाता है। हाइब्रिड सिस्टम में लेक्सिकल खोज के लिए स्टेट-ऑफ-द-आर्ट माना जाता है।
FAISS
उच्च-आयामी वेक्टर स्पेस में तेज समानता खोज के लिए फेसबुक AI की अनुकूलित लाइब्रेरी। हाइब्रिड रिट्रीवल सिस्टम के वेक्टर घटक को कुशलतापूर्वक लागू करने के लिए आवश्यक।
क्रॉस-एनकोडर
न्यूरल मॉडल आर्किटेक्चर जो क्वेरी और दस्तावेज़ को एक साथ एनकोड करता है ताकि उनकी आपसी प्रासंगिकता की भविष्यवाणी कर सके। बाय-एनकोडर की तुलना में अधिक सटीक लेकिन धीमा, अक्सर हाइब्रिड परिणामों के पुनः रैंकिंग के लिए उपयोग किया जाता है।
बाई-एनकोडर
प्रश्नों और दस्तावेजों को अलग-अलग वेक्टर में एनकोड करने वाली मॉडल आर्किटेक्चर जो वेक्टर खोज को कुशल बनाती है। बड़े पैमाने पर हाइब्रिड रिट्रीवल सिस्टम के घने घटक के लिए मूलभूत।
री-रैंकिंग
अंतिम सटीकता सुधारने के लिए अधिक जटिल मॉडलों का उपयोग करके प्रारंभिक खोज परिणामों का पुनर्मूल्यांकन और पुनर्व्यवस्थित करने की प्रक्रिया। सबसे प्रासंगिक दस्तावेजों के चयन को परिष्कृत करने के लिए हाइब्रिड पाइपलाइनों में महत्वपूर्ण चरण।
सिमेंटिक सिमिलैरिटी
दो ग्रंथों के बीच उनके सटीक शब्दों के बजाय उनके अर्थ के आधार पर वैचारिक निकटता का माप। आमतौर पर हाइब्रिड सिस्टम में उनके एम्बेडिंग के बीच कोसाइन दूरी के माध्यम से गणना की जाती है।
एम्बेडिंग फ्यूजन
ग्रंथ के विभिन्न सिमेंटिक पहलुओं को पकड़ने के लिए कई प्रकार के एम्बेडिंग या वेक्टर प्रतिनिधित्व को संयोजित करने की तकनीक। मल्टी-मोडल हाइब्रिड सिस्टम में वेक्टर खोज की मजबूती में सुधार करती है।
क्वेरी अंडरस्टैंडिंग
हाइब्रिड खोज रणनीति को अनुकूलित करने के लिए क्वेरी में उपयोगकर्ता के इरादों का विश्लेषण और व्याख्या करने की प्रक्रिया। इसमें इकाई पहचान, इरादा वर्गीकरण और सिमेंटिक विस्तार शामिल है।
कॉलबर्ट
दस्तावेज स्तर के बजाय टोकन स्तर पर एम्बेडिंग का उपयोग करने वाला संदर्भिक खोज मॉडल जो अधिकतम सूक्ष्मता प्रदान करता है। हाइब्रिड रिट्रीवल सिस्टम में टोकन-टू-टोकन तुलना की अनुमति देता है।
लेट फ्यूजन
संयोजन रणनीति जहां वेक्टर और कीवर्ड खोज परिणामों को उनके व्यक्तिगत मूल्यांकन के बाद मिलाया जाता है। क्वेरी की विशेषताओं के अनुसार गतिशील भारांकन की अनुमति देने वाला लचीला दृष्टिकोण।
अर्ली फ्यूजन
इंडेक्सिंग या दस्तावेज प्रतिनिधित्व स्तर पर वेक्टर और लेक्सिकल विशेषताओं को संयोजित करने वाला हाइब्रिड दृष्टिकोण। सिग्नलों का गहरा एकीकरण प्रदान करता है लेकिन अनुकूलन में कम लचीलापन होता है।
डेंस पैसेज रिट्रीवर
उच्च गुणवत्ता वाले एम्बेडिंग उत्पन्न करने के लिए बर्ट एनकोडर का उपयोग करके प्रासंगिक पैसेज पुनर्प्राप्त करने में विशेषज्ञ मॉडल। हाइब्रिड RAG प्रणालियों में वेक्टर खोज के लिए महत्वपूर्ण घटक।