قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
الفهرسة العكسية
هيكل بيانات يربط كل محتوى (مثل كلمة أو مصطلح) بقائمة المستندات التي يظهر فيها، مما يحسن البحث السريع عن المعلومات ذات الصلة في مجموعة كبيرة.
المسترجع الكثيف
نموذج استرجاع يقوم بترميز المستندات والاستعلامات في فضاء متجهي مستمر (كثيف) للعثور على التطابقات الأكثر تشابهًا دلاليًا، غالبًا عبر الشبكات العصبية.
المسترجع المتناثر
نهج استرجاع يعتمد على مطابقة الكلمات المفتاحية الدقيقة (المصطلحات) بين الاستعلام والمستندات، باستخدام تمثيلات متجهة عالية الأبعاد ولكنها فارغة في الغالب (متناثرة).
BM25 (أفضل تطابق 25)
دالة ترتيب احتمالية تستخدم في محركات البحث لتقييم مدى صلة مستند باستعلام، بناءً على تكرار المصطلحات وندرتها في المجموعة.
إعادة الترتيب
عملية من خطوتين حيث يقوم نموذج أول باسترجاع عدد كبير من المرشحين بسرعة، ثم يقوم نموذج ثانٍ، أكثر تعقيدًا وبطئًا، بإعادة ترتيب هؤلاء المرشحين لتحسين اختيار أفضل الإجابات.
FAISS (بحث التشابه بالذكاء الاصطناعي من فيسبوك)
مكتبة محسّنة للبحث السريع عن التشابه وتجميع المتجهات الكثيفة، مما يتيح إدارة مليارات التضمينات بكفاءة لاسترجاع المعلومات.
البحث عن أقصى ناتج داخلي (MIPS)
مشكلة حسابية تتمثل في العثور، في قاعدة بيانات للمتجهات، على المتجه الذي يزيد من الناتج الداخلي مع متجه استعلام معين، وهو أمر أساسي للاسترجاع الكثيف.
أقرب جار تقريبي (ANN)
مجموعة من الخوارزميات التي تجد نقاط بيانات قريبة من نقطة استعلام عن طريق التضحية بفقدان دقة لا يذكر مقابل مكاسب كبيرة في السرعة وكفاءة الذاكرة.
ColBERT (التفاعل المتأخر السياقي)
نموذج استرجاع يقوم بترميز كل مصطلح في الاستعلام والمستند ضمن سياقه، ثم يقيم الصلة من خلال تفاعل متأخر يعتمد على مجموع أقصى التشابهات بين المصطلحات.
إيلاستيك سيرش
محرك بحث وتحليل موزع، مبني على Apache Lucene، يستخدم على نطاق واسع لتنفيذ أنظمة استرجاع المعلومات بفضل قدراته على الفهرسة والاستعلام في الوقت الفعلي.
TF-IDF (تردد المصطلح - معكوس تردد المستند)
مقياس إحصائي يقيم أهمية كلمة في مستند مقارنة بمجموعة من المستندات، حيث تزداد أهميتها مع تكرارها في المستند وتقل مع تكرارها في المجموعة.