قاموس الذكاء الاصطناعي
القاموس الكامل للذكاء الاصطناعي
مجموعة الاحتجاز
مجموعة فرعية من البيانات يتم الاحتفاظ بها بشكل منفصل ولا تُستخدم أثناء تدريب النموذج لتقييم أدائه النهائي بموضوعية. تظل هذه المجموعة معزولة تمامًا حتى التقييم النهائي لتجنب أي تلوث للمعلومات.
الاختبار في العالم الحقيقي
مرحلة التحقق حيث يتم نشر النموذج في ظروف تشغيلية حقيقية لتقييم أدائه في سياقه الطبيعي للاستخدام. غالبًا ما يكشف هذا الاختبار عن سلوكيات غير متوقعة لم تُلاحظ أثناء عمليات التحقق في المختبر.
اختبار الإنتاج
عملية التحقق المستمر من النماذج بعد نشرها في الإنتاج لمراقبة أدائها واكتشاف أي تدهور. هذه الخطوة ضرورية للحفاظ على موثوقية أنظمة الذكاء الاصطناعي في بيئة تشغيلية.
اختبار وضع الظل
طريقة تحقق حيث يعمل نموذج جديد بالتوازي مع نظام الإنتاج دون التأثير على القرارات النهائية، مما يسمح بمقارنة أدائه بالنموذج الحالي. يقلل هذا النهج من المخاطر عند تقييم الإصدارات الجديدة.
التحقق الزمني
استراتيجية تحقق تحترم الترتيب الزمني للبيانات باستخدام البيانات الماضية فقط للتدريب والبيانات المستقبلية للاختبار. يحاكي هذا النهج ظروف النشر الحقيقية ويتجنب تسرب المعلومات الزمنية.
التحقق الجغرافي
تحقق خارجي حيث يتم اختبار النموذج على بيانات من مناطق جغرافية مختلفة عن تلك المستخدمة للتدريب. هذه التقنية حاسمة لتقييم قدرة النماذج على التعميم المكاني.
تحول السكان
تغير في الخصائص الديموغرافية أو الإحصائية للسكان المستهدفين بين تدريب النموذج ونشره. يمكن أن تؤثر هذه الظاهرة بشكل كبير على أداء وعدالة التنبؤات.
التحقق البيئي
اختبار النموذج في ظروف بيئية متنوعة (الضوء، الضوضاء، درجة الحرارة) لتقييم مدى قوته تجاه العوامل الخارجية. هذا التحقق مهم بشكل خاص لأنظمة الرؤية وأجهزة استشعار إنترنت الأشياء.
التحقق متعدد المواقع
تقييم أداء نموذج على بيانات تم جمعها من عدة مواقع أو مؤسسات متميزة لاختبار قابليته للتعميم. هذا النهج قياسي في المجال الطبي لضمان صلاحية النماذج التشخيصية.