قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
البيانات المفقودة بشكل كامل عشوائي (MCAR)
آلية حيث لا يعتمد احتمال فقدان البيانات على البيانات المرصودة أو البيانات المفقودة. تمثل البيانات المفقودة مجموعة فرعية عشوائية بسيطة من مجموعة البيانات الكاملة.
البيانات المفقودة عشوائياً (MAR)
آلية حيث يعتمد احتمال فقدان البيانات فقط على القيم المرصودة وليس على القيم المفقودة نفسها. يسمح هذا النمط بالتصحيح عن طريق الاستبدال الشرطي للمتغيرات المرصودة.
البيانات المفقودة غير عشوائية (MNAR)
آلية حيث يعتمد احتمال فقدان البيانات مباشرة على القيم المفقودة نفسها. يمكن لطرق الاستبدال القياسية أن تقدم تحيزاً كبيراً في هذه الحالة.
اختبار ليتل للبيانات المفقودة بشكل كامل عشوائي (MCAR)
اختبار فرضية إحصائية للفرضية الصفرية بأن البيانات مفقودة بشكل كامل عشوائي (MCAR). يعتمد على مقارنة المتوسطات والتغايرات بين الحالات الكاملة وغير الكاملة.
مصفوفة النمط
مصفوفة ثنائية تشير إلى وجود (1) أو غياب (0) البيانات لكل ملاحظة ومتغير. تسمح بتحديد هياكل البيانات المفقودة المعقدة بصرياً.
آلية البيانات المفقودة
العملية الأساسية التي تولد البيانات المفقودة في مجموعة البيانات. تشمل ثلاث آليات رئيسية: MCAR وMAR وMNAR، كل منها يتطلب طرق معالجة مختلفة.
تحليل الحالة الكاملة
طريقة تحليل تستخدم فقط الملاحظات التي لا تحتوي على أي قيم مفقودة. سهلة التنفيذ ولكن يمكن أن تؤدي إلى فقدان كبير للبيانات وتحيزات إذا لم يتم التحقق من MCAR.
تحليل الحالة المتاحة
نهج يستخدم جميع البيانات المتاحة لكل حساب إحصائي، مما يسمح بأحجام عينات مختلفة حسب المتغيرات. يتضمن طرق الحذف الزوجي والحذف القائم على القائمة.
نمط الفقدان الرتيب
هيكل حيث إذا كانت متغير ما مفقودًا لملاحظة معينة، فإن جميع المتغيرات التالية في ترتيب محدد مسبقًا تكون مفقودة أيضًا. يبسط بشكل كبير طرق التعويض المتعدد.
ارتباط الفقدان
قياس الارتباط بين أنماط البيانات المفقودة للمتغيرات المختلفة. قد يشير الارتباط القوي إلى آلية MAR أو يقترح علاقات هيكلية في البيانات.
تصور البيانات المفقودة
مجموعة من التقنيات الرسومية (خرائط حرارية، رسوم بيانية شريطية، رسوم أنماط) لاستكشاف وتوصيل هيكل ومدى البيانات المفقودة. أساسي للتشخيص الأولي.
تحليل معدل الاستجابة
تقييم منهجي لمعدلات الاستجابة حسب المتغير، أو المجموعة، أو عبر الزمن. يسمح بتحديد العوامل المرتبطة بعدم الاستجابة واكتشاف التحيزات المحتملة.
تشخيص البيانات المفقودة
عملية تقييم شاملة لخصائص وأنماط وآليات البيانات المفقودة قبل التعويض. تجمع بين التحليلات الإحصائية والتصورات لتوجيه المعالجة المناسبة.
نمط الفقدان العشوائي
هيكل البيانات المفقودة بدون تنظيم خاص حيث يمكن أن تحدث حالات الغياب في أي مكان في مجموعة البيانات. يتطلب طرق تعويض أكثر تطورًا مثل MICE.
ملف البيانات المفقودة
تقرير موجز يصف توزيع وأنماط وخصائص البيانات المفقودة. يتضمن إحصائيات وصفية وتصورات للتقييم الشامل.