قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
نقل اللغة المتقاطع (Cross-Lingual Transfer)
قدرة نموذج التعرف على الكيانات المسماة (NER) المدرب على لغة مصدر على تطبيق معرفته للتعرف على الكيانات في لغة هدف، دون الحاجة إلى بيانات مشروحة لهذه الأخيرة.
نموذج متعدد اللغات موحد
هندسة التعرف على الكيانات المسماة (NER) حيث يتم تدريب نموذج واحد في وقت واحد على بيانات من لغات متعددة، ويشارك تمثيلات متجهية لالتقاط أنماط عالمية للتعرف على الكيانات.
محاذاة الفضاءات المتجهية
تقنية تهدف إلى إسقاط الفضاءات الدلالية للغات مختلفة في فضاء متجهي مشترك، مما يسمح للنموذج بمعالجة ومقارنة الكلمات أو الكيانات من لغات متميزة.
الضبط الدقيق متعدد اللغات (Multilingual Fine-Tuning)
عملية تكييف نموذج لغوي مدرب مسبقًا على مجموعات كبيرة من النصوص متعددة اللغات، وتخصيصه لمهمة التعرف على الكيانات المسماة (NER) باستخدام مجموعة بيانات مشروحة بلغات متعددة.
التعرف على الكيانات المسماة بتبديل الشفرة (Code-Switching NER)
تحدي التعرف على الكيانات المسماة (NER) متعدد اللغات الذي يتكون من التعرف على الكيانات داخل نص يتناوب فيه المتحدثون بين لغات متعددة، غالبًا ضمن نفس الجملة.
الكيانات عبر اللغات
الكيانات المسماة التي تحتفظ بنفس الشكل أو المرجع عبر لغات متعددة، مثل أسماء العلامات التجارية (Google)، المنظمات (ONU)، أو الأشخاص (Barack Obama).
تكييف المجال متعدد اللغات
تقنية لضبط نموذج التعرف على الكيانات المسماة (NER) متعدد اللغات ليناسب مجالًا معينًا (طبي، قانوني) باستخدام بيانات غير مشروحة أو مشروحة بشكل ضعيف بلغات متعددة.
تضمينات الأحرف متعددة اللغات
تمثيلات متجهية على مستوى الأحرف، مشتركة بين اللغات، تسمح للنموذج بالتقاط تشكيلات متشابهة (مثل: الجذور اللاتينية) والتعميم على كلمات جديدة.
التعليق المسقط (Projected Annotation)
طريقة لإنشاء بيانات تدريب للتعرف على الكيانات المسماة (NER) في لغة مستهدفة باستخدام نظام ترجمة آلية لإسقاط تسميات الكيانات من لغة مصدر مشروحة.
نماذج الموارد المنخفضة (Low-Resource NER)
أنظمة التعرف على الكيانات المسماة (NER) مصممة للعمل بكميات محدودة جدًا من البيانات المشروحة في لغة أو عدة لغات مستهدفة، غالبًا من خلال نقل التعلم من اللغات ذات الموارد العالية.
توحيد الكيانات متعددة اللغات (Multilingual Entity Normalization)
مهمة تجميع المتغيرات اللغوية أو الإملائية المختلفة لنفس الكيان (مثال: 'New York', 'Nueva York', 'New York City') تحت معرف قانوني فريد.
التقييم متعدد اللغات (Multilingual Evaluation)
عملية قياس أداء نظام التعرف على الكيانات المسماة (NER) على مجموعة متنوعة من اللغات، غالبًا باستخدام مقاييس قياسية (الدقة، الاستدعاء، درجة F1) محسوبة لكل لغة وبشكل مجمع.
نماذج اللغات الكبيرة متعددة اللغات (mLLM)
نماذج أساسية مثل mBERT أو XLM-R، مدربة مسبقًا على مئات اللغات، والتي تعمل كأساس لبناء أنظمة التعرف على الكيانات المسماة (NER) متعددة اللغات عالية الأداء عن طريق الضبط الدقيق (fine-tuning).
اكتشاف اللغة للتعرف على الكيانات المسماة (Language Detection for NER)
خطوة أولية حاسمة في مسارات عمل التعرف على الكيانات المسماة (NER) متعددة اللغات تتضمن تحديد لغة النص المدخل لتنشيط نموذج التعرف على الكيانات المناسب.
التعرف على الكيانات المسماة المستقل عن الخط (Script-Independent NER)
قدرة نموذج التعرف على الكيانات المسماة (NER) على التعرف على الكيانات بغض النظر عن نظام الكتابة (الأبجدية اللاتينية، السيريلية، العربية، إلخ)، بالاعتماد على تمثيلات مجردة للغة.
الترجمة العكسية للتعرف على الكيانات المسماة (Back-Translation for NER)
تقنية زيادة البيانات حيث يتم ترجمة نص مشروح في لغة مصدر إلى لغة مستهدفة، ثم إعادة ترجمته إلى اللغة المصدر، لإنشاء أمثلة تدريب جديدة قوية.