এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
এ/বি টেস্টিং
পূর্বনির্ধারিত মেট্রিক্স অনুযায়ী কোনটি ভালো পারফর্ম করে তা নির্ধারণের জন্য একটি মডেল বা পরিষেবার দুটি সংস্করণ (এ এবং বি) তুলনা করার পরীক্ষামূলক পদ্ধতি, সাধারণত ট্রাফিকের এলোমেলো বন্টনের মাধ্যমে।
মাল্টিভেরিয়েট টেস্টিং
একই সময়ে একাধিক ভেরিয়েবল এবং তাদের সংমিশ্রণ পরীক্ষা করার উন্নত কৌশল যা সামগ্রিক অপ্টিমাইজেশন শনাক্ত করতে সাহায্য করে, মডেলের বিভিন্ন ফ্যাক্টরের মধ্যে ইন্টারঅ্যাকশন মূল্যায়ন করতে সক্ষম করে।
ব্লু-গ্রিন ডিপ্লয়মেন্ট
দুটি অভিন্ন পরিবেশ সহ ডিপ্লয়মেন্ট প্যাটার্ন যেখানে সম্পূর্ণ ভ্যালিডেশনের পর ট্রাফিক পুরানো সংস্করণ (ব্লু) থেকে নতুন সংস্করণে (গ্রিন) সম্পূর্ণরূপে স্যুইচ হয়, ডাউনটাইম ন্যূনতম রাখে।
ফিচার ফ্ল্যাগ
নিয়ন্ত্রণ ব্যবস্থা যা রিডিপ্লয়মেন্ট ছাড়াই নির্দিষ্ট কার্যকারিতা বা মডেলগুলি গতিশীলভাবে সক্রিয়/নিষ্ক্রিয় করতে দেয়, এক্সপেরিমেন্ট এবং দ্রুত রোলব্যাক সহজ করে।
ট্রাফিক স্প্লিটিং
ইন্টেলিজেন্ট রাউটিং কৌশল যা কনফিগারযোগ্য নিয়ম অনুযায়ী মডেলের বিভিন্ন সংস্করণের মধ্যে অনুপাতিকভাবে রিকোয়েস্ট বন্টন করে এ/বি টেস্টিং বা ধাপে ধাপে ডিপ্লয়মেন্টের জন্য।
স্ট্যাটিস্টিক্যাল সিগনিফিক্যান্স
সম্ভাব্যতা ভিত্তিক পরিমাপ যা নির্ধারণ করে যে পরীক্ষিত ভেরিয়েন্টগুলির মধ্যে পর্যবেক্ষিত পার্থক্যগুলি দৈবচয়নের পরিবর্তে প্রকৃত প্রভাবের কারণে কিনা, সাধারণত p-ভ্যালু < 0.05 থ্রেশহোল্ড সহ।
P-ভ্যালু
নাল হাইপোথিসিস সত্য হলে পরিমাপ করা ফলাফলের কমপক্ষে সেই চরম পর্যবেক্ষণ করার সম্ভাবনা, যা হাইপোথিসিস টেস্টিংয়ে সিদ্ধান্তমূলক মানদণ্ড হিসেবে কাজ করে।
কনফিডেন্স ইন্টারভাল
অনুমানকৃত মানের পরিসর যা একটি সংজ্ঞায়িত সম্ভাবনা (সাধারণত 95%) সহ পরিমাপ করা প্যারামিটারের প্রকৃত মান ধারণ করে, পরীক্ষামূলক অনুমানের অনিশ্চয়তা পরিমাপ করে।
Control Group
Échantillon de population recevant la version de référence (généralement le modèle actuel) servant de baseline pour comparaison statistique avec les variantes expérimentales.
Treatment Group
Segment de population exposé à la variante expérimentale du modèle ou traitement testé, permettant de mesurer l'impact relatif par rapport au groupe de contrôle.
Baseline Model
Modèle de référence utilisé comme point de comparaison pour évaluer les améliorations apportées par de nouvelles versions, souvent le modèle actuellement en production.
Champion-Challenger
Stratégie de compétition continue où le modèle champion actuel est constamment défié par des modèles challengers, le meilleur performer remplaçant progressivement le champion.
Progressive Rollout
Déploiement incrémental d'un nouveau modèle avec augmentation graduelle du pourcentage de trafic, permettant une validation continue et une minimisation des risques d'impact négatif.
Experimentation Platform
Infrastructure centralisée gérant le cycle de vie complet des expérimentations, de la création des variantes à l'analyse statistique des résultats et l'automatisation des décisions.
Metric Drift
Phénomène de dégradation progressive des métriques de performance d'un modèle en production, détecté via le monitoring continu et nécessitant des réévaluations périodiques.
Sample Size Calculation
Processus statistique déterminant le nombre minimum d'observations requis pour détecter une différence significative avec une puissance statistique donnée, essentiel pour la planification des tests.
বেইজিয়ান এ/বি টেস্টিং
বিকল্পগুলির মূল্যায়নের জন্য বেইজিয়ান সম্ভাবনা ব্যবহার করে একটি বিকল্প পদ্ধতি, যা ছোট নমুনা সহ ধারাবাহিক সিদ্ধান্ত নেওয়া এবং ফলাফলের স্বজ্ঞাত ব্যাখ্যা সম্ভব করে।
সিকোয়েন্সিয়াল টেস্টিং
প্রিসেট ব্যবধানে ফলাফল মূল্যায়নের অনুমতি দেয় এমন বিশ্লেষণ পদ্ধতি, টাইপ I ত্রুটি ঝুঁকি বৃদ্ধি ছাড়াই, পরীক্ষার সময়কাল এবং খরচ অপ্টিমাইজ করে।