قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
البحث الهجين
نهج بحث يجمع بين طرق البحث المتجهي والبحث بالكلمات المفتاحية لتحسين الدقة والاستدعاء في أنظمة RAG. تستغل هذه التقنية نقاط قوة البحث الدلالي والبحث المعجمي للحصول على نتائج أكثر شمولاً.
البحث المتجهي
طريقة بحث تعتمد على التشابه الدلالي للتضمينات المتجهية في فضاء متعدد الأبعاد عالي الأبعاد. تتيح العثور على وثائق ذات صلة حتى بدون تطابق تام للكلمات المفتاحية بفضل فهم السياق.
البحث بالكلمات المفتاحية
تقنية بحث تقليدية تعتمد على التطابق التام أو الجزئي للمصطلحات في الوثائق والاستعلام. تستخدم خوارزميات مثل BM25 لتقييم الصلة بناءً على التكرار وتوزيع المصطلحات.
الاسترجاع المتناثر
طريقة بحث تستخدم تمثيلات متناثرة للنص تعتمد على وجود أو غياب مصطلحات محددة. أكثر فعالية من حيث الحساب وممتازة لمطابقات الكلمات المفتاحية التامة.
دمج الرتبة المتبادلة
خوارزمية دمج نتائج البحث تجمع تصنيفات أنظمة بحث متعددة باستخدام صيغة ترجيح توافقية. تتيح الحصول على تصنيف قوي باستغلال التكامل بين النهج.
خوارزمية BM25
خوارزمية تصنيف احتمالية تعتمد على تكرار المصطلحات وطول الوثائق، تُستخدم على نطاق واسع في محركات البحث بالكلمات المفتاحية. تعتبر الأحدث للبحث المعجمي في الأنظمة الهجينة.
FAISS
مكتبة مُحسنة من Facebook AI للبحث السريع عن التشابه في الفضاءات المتجهية عالية الأبعاد. أساسية لتنفيذ المكون المتجهي لأنظمة الاسترجاع الهجينة بكفاءة.
المشفر المتقاطع
هندسة نموذج عصري تشفر الاستعلام والوثيقة في وقت واحد للتنبؤ بصلتهما المتبادلة. أكثر دقة ولكن أبطأ من المشفرات المزدوجة، غالباً ما تُستخدم لإعادة تصنيف النتائج الهجينة.
Bi-Encoder
هندسة نموذج تشفر الاستعلامات والمستندات بشكل منفصل إلى متجهات مستقلة للبحث المتجهي الفعال. أساسي للمكون الكثيف في أنظمة الاسترجاع الهجينة واسعة النطاق.
Re-ranking
عملية إعادة تقييم وإعادة تنظيم نتائج البحث الأولية باستخدام نماذج أكثر تعقيدًا لتحسين الدقة النهائية. خطوة حاسمة في خطوط الأنابيب الهجينة لتحسين اختيار المستندات الأكثر صلة.
Semantic Similarity
قياس القرب المفاهيمي بين نصين بناءً على معناهما بدلاً من كلماتهما الدقيقة. يتم حسابها عادةً عبر مسافة جيب التمام بين تضميناتهما في الأنظمة الهجينة.
Embedding Fusion
تقنية تجمع بين عدة أنواع من التضمينات أو التمثيلات المتجهة لالتقاط جوانب دلالية مختلفة للنص. تعزز متانة البحث المتجهي في الأنظمة الهجينة متعددة الوسائط.
Query Understanding
عملية تحليل وتفسير نوايا المستخدم في الاستعلامات لتحسين استراتيجية البحث الهجين. تتضمن كشف الكيانات وتصنيف النوايا والتوسع الدلالي.
ColBERT
نموذج بحث سياقي يستخدم تضمينات على مستوى الرموز بدلاً من مستوى المستند لأقصى درجة من الدقة. يسمح بمقارنات دقيقة رمزًا برمز في أنظمة الاسترجاع الهجينة.
Late Fusion
استراتيجية دمج حيث يتم دمج نتائج البحث المتجهي والبحث بالكلمات المفتاحية بعد تقييمها الفردي. نهج مرن يسمح بأوزان ديناميكية وفقًا لخصائص الاستعلام.
Early Fusion
نهج هجين يجمع بين الخصائص المتجهية والمعجمية على مستوى الفهرسة أو التمثيل الوثائقي. يسمح بدمج عميق للإشارات ولكن مع مرونة تكيف أقل.
استرجاع المقاطع الكثيفة
نموذج متخصص في استرجاع المقاطع ذات الصلة باستخدام مشفرات BERT لتوليد تضمينات عالية الجودة. مكون رئيسي للبحث المتجهي في أنظمة RAG الهجينة.