এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
ক্রস ভ্যালিডেশন
মডেলের সাধারণীকরণ পরীক্ষা করার জন্য একাধিক পুনরাবৃত্তিতে ডেটাকে সাবসেটে বিভক্ত করে এমন মূল্যায়ন কৌশল।
পরিসংখ্যানগত পরীক্ষা
বিভিন্ন মডেল বা কনফিগারেশনের মধ্যে কর্মক্ষমতা তুলনা করার জন্য আনুষ্ঠানিক পরিসংখ্যানগত পদ্ধতি।
পারফরম্যান্স মেট্রিক্স
প্রাসঙ্গিকতা অনুযায়ী পূর্বাভাসের গুণমান পরিমাপ করার জন্য পরিমাণগত সূচকগুলির সেট (প্রিসিশন, রিকল, F1-স্কোর, MAE, RMSE)।
বায়াস-ভ্যারিয়েন্স বিশ্লেষণ
বায়াস (আন্ডারফিটিং) এবং ভ্যারিয়েন্স (ওভারফিটিং) এর জন্য জেনারেলাইজেশন ত্রুটির বিভাজন মডেলের জটিলতা অপ্টিমাইজ করার জন্য।
রবাস্টনেস পরীক্ষা
ইনপুট ডেটার বিঘ্ন, নয়েজ এবং পরিবর্তনের মুখোমুখি পূর্বাভাসের স্থিতিশীলতা মূল্যায়ন
সময়ভিত্তিক যাচাইকরণ
সিকোয়েন্সিয়াল ডেটার জন্য নির্দিষ্ট পদ্ধতিতে যেখানে প্রশিক্ষণের জন্য পরীক্ষার পূর্ববর্তী সময়কাল ব্যবহার করা হয় বাস্তব অবস্থার অনুকরণ করতে।
ROC বক্ররেখা এবং AUC
বিভিন্ন সিদ্ধান্ত থ্রেশহোল্ডে বাইনারি শ্রেণীবিভাজকগুলির কার্যকারিতা মূল্যায়ন করার জন্য গ্রাফিকাল সরঞ্জাম এবং মেট্রিক্স।
মডেল ক্যালিব্রেশন
ভবিষ্যদ্বাণী করা সম্ভাবনাগুলিকে এমনভাবে সামঞ্জস্য করা যাতে সেগুলি ঘটনাগুলির প্রকৃত ঘটনার কম্পাঙ্ককে নির্ভুলভাবে প্রতিফলিত করে।
ইক্যুইটি পরীক্ষা
নৈতিক ও নিয়ন্ত্রকমূলক মানদণ্ড অনুযায়ী মডেলের জনসংখ্যাগত পক্ষপাত এবং সম্ভাব্য বৈষম্যের মূল্যায়ন।
Analyse d'Erreurs
Examen systématique des prédictions incorrectes pour identifier les schémas d'échec et guider l'amélioration du modèle.
Validation par Bootstrap
Technique de rééchantillonnage avec remplacement pour estimer la variabilité et la fiabilité des métriques de performance.
Tests de Stress
Évaluation du comportement du modèle dans des conditions extrêmes ou edge cases pour identifier ses limites opérationnelles.
Tests de Sensibilité
Analyse de l'impact des variations des caractéristiques d'entrée sur les prédictions pour comprendre la stabilité du modèle.
Validation Externe
Test du modèle sur des données provenant de sources ou distributions complètement nouvelles pour évaluer sa capacité de généralisation.
Tests de Dégradation
Suivi continu de la performance du modèle en production pour détecter les drifts de données et la dégradation temporelle.