قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
تجميع K-Means
خوارزمية تقسيم تقسم المستندات إلى K مجموعات عن طريق تقليل التباين داخل المجموعة، مع تعيين كل مستند إلى أقرب مركز.
التجميع الهرمي
طريقة تجميع تبني تسلسلاً هرميًا من المجموعات المتداخلة، إما عن طريق نهج تصاعدي (تجميعي) أو تنازلي (تقسيمي)، ممثلة بمخطط شجري.
مؤشر جاكارد
معامل تشابه يقيس التشابه بين مجموعتين من المستندات عن طريق حساب نسبة تقاطعهما على اتحادهما.
تحليل الدلالات الكامنة (LSA)
تقنية تقليل الأبعاد تستخدم تحليل القيمة المفردة (SVD) لاكتشاف العلاقات الدلالية الكامنة بين المصطلحات والمستندات.
N-grams
تسلسلات متصلة من n عنصر (كلمات، أحرف) في نص تستخدم لالتقاط السياق المحلي وتحسين التمثيل الدلالي للمستندات.
طريقة الكوع
تقنية استدلالية لتحديد العدد الأمثل للمجموعات عن طريق تحديد النقطة التي لا يقلل فيها إضافة مجموعات إضافية التباين داخل المجموعة بشكل كبير.
التجميع التراكمي
نهج تصاعدي للتجميع الهرمي يدمج بشكل متكرر أقرب المجموعات حتى يتم الوصول إلى معيار توقف محدد مسبقًا.
تجميع المستندات
عملية التجميع التلقائي للمستندات في مجموعات بناءً على تشابه محتواها، مما يتيح تنظيم واكتشاف الهياكل الموضوعية.
تردد المصطلح
قياس معياري لتردد ظهور مصطلح في مستند، يُستخدم غالبًا كمكون أساسي في نماذج التمثيل المتجهي.
مصفوفة المستند-المصطلح
هيكل بيانات جدولي حيث يمثل كل صف مستندًا وكل عمود مصطلحًا من المفردات، مع احتواء الخلايا على الأوزان المرتبطة.