قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
خوارزمية الجيران الأقرب k (k-NN)
خوارزمية تعلم خاضعة للإشراف غير بارامترية التي تصنف ملاحظة جديدة بناءً على الفئة الأكثر شيوعًا بين جيرانها k الأقرب في فضاء الميزات.
المسافة الإقليدية
مقياس مسافة قياسي في الفضاء الإقليدي، يتم حسابه كالجذر التربيعي لمجموع مربعات الفروق بين إحداثيات نقطتين.
مسافة مانهاتن
مقياس مسافة يتم حسابه كمجموع القيم المطلقة للفروق بين إحداثيات نقطتين، يُعرف أيضًا بالمسافة L1 أو مسافة التاكسي.
مسافة مينكوفسكي
مقياس مسافة معمم يشمل المسافة الإقليدية (p=2) ومانهاتن (p=1) كحالات خاصة، يُعرّف بالجذر p-th لمجموع الفروق المطلقة المرفوعة للقوة p.
الترجيح بالمسافة
متغير من التصويت بالأغلبية حيث يكون للجيران الأقرب تأثير أكبر على التصنيف النهائي، عادةً باستخدام عكس المسافة كوزن.
شجرة KD
بنية بيانات تقسّم الفضاء k-الأبعاد لتسريع البحث عن الجيران الأقرب، مما يقلل التعقيد من O(n) إلى O(log n) في المتوسط.
شجرة الكرة
بنية بيانات هرمية تنظم النقاط في كرات متداخلة، فعالة للبحث عن الجيران الأقرب في الأبعاد العالية حيث تصبح أشجار KD غير فعالة.
لعنة البعدية
ظاهرة تتراجع فيها أداء الخوارزميات القائمة على المسافة في الأبعاد العالية لأن جميع المسارات تميل إلى أن تصبح متكافئة، مما يجعل مفهوم 'الأقرب' أقل أهمية.
معامل k الفائق
عدد الجيران الذي يجب مراعاته في خوارزمية k-NN، حاسم لتحقيق التوازن بين التحيز والتباين: k صغير ينشئ نموذجاً معقداً، وk كبير ينشئ نموذجاً أكثر سلاسة.
توحيد البيانات
معالجة مسبقة ضرورية لـ k-NN حيث يتم وضع الخصائص على نفس النطاق لتجنب هيمنة المتغيرات ذات النطاقات الكبيرة على حساب المسافة.
k-NN للانحدار
متغير من k-NN حيث تكون التنبؤات هي المتوسط (أو المتوسط الموزون) لقيم k الجيران الأقرب بدلاً من التصويت بالأغلبية للفئة.
مسافة هامنغ
مقياس مسافة للبيانات الفئوية الثنائية، يحسب كعدد المواضع التي يختلف فيها متجهان، يستخدم عندما تكون الخصائص ثنائية أو فئوية.
طريقة الكوع
تقنية لاختيار k الأمثل عن طريق رسم معدل الخطأ مقابل k واختيار النقطة التي يبدأ فيها التحسن في التناقص بشكل كبير (الكوع).
التحقق المتقاطع K-Fold
طريقة تقييم قوية لـ k-NN حيث يتم تقسيم البيانات إلى k مجموعات فرعية، مما يسمح بتقدير موثوق للأداء ويساعد في اختيار k الأمثل.
البحث الشامل
نهج ساذج للعثور على أقرب k جيران عن طريق حساب المسافة إلى جميع النقاط في مجموعة البيانات، بتعقيد O(n) لكل استعلام.
أقرب جيران تقريبي (ANN)
عائلة من الخوارزميات التي تجد الجيران الأقرب تقريبياً مع توازن بين الدقة والسرعة، ضرورية لمجموعات البيانات الكبيرة.