قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
نمط التعبير العادي (Regex)
تعبير عادي يستخدم لوصف نمط بحث داخل سلسلة نصية، وهو ضروري لاستخراج الكيانات بناءً على تنسيقات نصية محددة.
قاعدة لغوية
مبدأ مستمد من قواعد اللغة أو تركيبها، يُطبق لتقييد أو توجيه تحديد الكيانات في نظام التعرف على الكيانات المسماة (NER) القائم على القواعد.
قائمة أسماء جغرافية (Gazetteer)
قائمة أو قاموس مرجعي للأسماء الخاصة (مثل: المدن، الأسماء الأولى) تستخدمها أنظمة التعرف على الكيانات المسماة (NER) للتحقق من الكيانات أو التعرف عليها عن طريق البحث النصي البسيط.
قاعدة قائمة على النافذة
نوع من القواعد يفحص رمزًا وسياقه المباشر (نافذة من الكلمات) ليقرر ما إذا كان يشكل كيانًا، بناءً على كلمات أو تسميات محددة.
غموض اسمي
ظاهرة حيث يمكن لمصطلح واحد أن يشير إلى أنواع مختلفة من الكيانات (مثال: 'باريس' كمدينة أو شخص)، مما يشكل تحديًا لأنظمة التعرف على الكيانات المسماة (NER) القائمة على القواعد.
قاعدة السياق الأيسر/الأيمن
قاعدة تحدد كيانًا بناءً على كلمات أو أنماط محددة تظهر مباشرة قبل (السياق الأيسر) أو بعد (السياق الأيمن) المرشح.
تطبيع نصي
معالجة مسبقة تنظف النص وتوحده (مثال: إزالة علامات الترقيم، التحويل إلى أحرف صغيرة) لتحسين فعالية أنماط التعبير العادي والقواعد اللغوية.
قاعدة الأحرف الكبيرة
قاعدة استدلالية تستغل الأحرف الكبيرة لتحديد الكيانات المحتملة، مثل الأسماء الخاصة أو بدايات الجمل.
تعبير النمط
صياغة رسمية لقاعدة بحث، غالبًا ما تكون أكثر تعقيدًا من تعبير نمطي بسيط (regex)، وقد تتضمن قيودًا على العلامات النحوية أو بنية الجمل.
إزالة الغموض
عملية حل الغموض لتحديد النوع الصحيح للكيان عندما يمكن أن ينتمي مرشح لعدة أنواع، غالبًا عبر قواعد هرمية.
قاعدة الاستبعاد
قاعدة تحدد شروطًا، إذا تحققت، تمنع جزءًا من النص من أن يُصنف ككيان، مما يقلل من الإيجابيات الخاطئة.