قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
التوسيع القوي
تقنية تستخدم الكميات لمقاومة القيم الشاذة، عادةً بتطبيق (x - الوسيط)/IQR حيث يمثل IQR المدى الربيعي. هذا النهج يحافظ على استقرار التحويلات حتى في وجود بيانات مشوشة أو متطرفة.
التطبيع L1
طريقة توسيع تقسم كل قيمة على المجموع المطلق لجميع القيم في المتجه، مما يضمن أن القاعدة L1 تساوي 1. هذا التحويل مفيد بشكل خاص للنماذج القائمة على الاحتمالات والتمثيلات المتفرقة.
التطبيع L2
إجراء يقوم بتطبيع المتجهات عن طريق قسمة كل مكون على الجذر التربيعي لمجموع المربعات، مما يضمن قاعدة إقليدية وحدة. هذه التقنية أساسية للخوارزميات الحساسة لحجم المتجه مثل SVM والشبكات العصبية.
التطبيع بالكميات
تقنية غير معلمية تحول البيانات لتتبع توزيعًا موحدًا أو طبيعيًا محددًا باستخدام دوال التوزيع التراكمي للكميات. هذا النهج فعال بشكل خاص للتعامل مع التوزيعات شديدة الانحراف أو متعددة الوسائط.
التوسيع بوحدة المتجه
تطبيع يقسم كل متجه على قاعدته الإقليدية، مما ينتج متجهات بطول وحدة في الفضاء متعدد الأبعاد. هذه الطريقة حاسمة للخوارزميات القائمة على قياسات التشابه الجيبي والتمثيلات النصية.
التطبيع العشري
تقنية بسيطة تقسم القيم على قوة العدد 10 لإرجاعها إلى المجال [-1,1]، بناءً على العدد الأقصى للأرقام قبل الفاصلة. هذه الطريقة تحافظ على الترتيب النسبي للحجم مع تقليل المقياس العددي المطلق.
المعايرة القوية
نوع من المعايرة يستخدم الوسيط والانحراف المطلق عن الوسيط (MAD) كمقاييس للنزعة المركزية والتشتت، مما يوفر مقاومة متزايدة للقيم الشاذة. هذا النهج يحافظ على القابلية للتفسير مع ضمان المتانة.
التوسيع اللوغاريتمي
تحويل يطبق log(x + c) حيث c ثابت للتعامل مع القيم الصفرية، مما يضغط بشكل فعال مقياس القيم الكبيرة. هذه الطريقة مناسبة بشكل خاص للبيانات التي تتبع قانون القوة أو تظهر انحرافًا يمينيًا.
التطبيع بالرتبة
تقنية غير معلمية تستبدل كل قيمة برتبتها الطبيعية في مجموعة البيانات، مما يزيل تأثير القيم المتطرفة. هذا النهج مقاوم للقيم الشاذة ويحافظ فقط على الترتيب النسبي للملاحظات.
التوحيد بالوسيط
طريقة تركز البيانات حول الوسيط بدلاً من المتوسط، مع القسمة على مقياس تشتت قوي مثل المدى الربيعي. هذا النهج يوفر مقاومة أفضل للتوزيعات غير المتناظرة والقيم الشاذة.
القياس بأقصى قيمة مطلقة
تقنية بسيطة تقسم كل قيمة على القيمة المطلقة القصوى للميزة، محافظة على الإشارات والأصفار مع تحديد القيم في المدى [-1,1]. هذه الطريقة فعالة بشكل خاص للبيانات المتمركزة مسبقاً أو المتفرقة.
التطبيع بالتباين
إجراء يوحد المتغيرات بالقسمة على تباينها، مما يساوي أهمية كل ميزة في الخوارزميات الحساسة للمقياس. هذا النهج مفيد بشكل خاص لتحليل المكونات الرئيسية وانحدار الحافة.
التوحيد بمعامل الاختلاف
طريقة متقدمة تطبع البيانات بالقسمة على معامل الاختلاف (σ/μ)، مما يسمح بمقارنة متغيرات بمتوسطات وتباينات مختلفة. هذه التقنية مناسبة بشكل خاص للبيانات حيث يكون التباين النسبي أكثر أهمية من التباين المطلق.