A/B টেস্টিং এবং পরীক্ষা-নিরীক্ষা - কৃত্রিম বুদ্ধিমত্তা শব্দাবলী

📖

শব্দ

এ/বি টেস্টিং

পূর্বনির্ধারিত মেট্রিক্স অনুযায়ী কোনটি ভালো পারফর্ম করে তা নির্ধারণের জন্য একটি মডেল বা পরিষেবার দুটি সংস্করণ (এ এবং বি) তুলনা করার পরীক্ষামূলক পদ্ধতি, সাধারণত ট্রাফিকের এলোমেলো বন্টনের মাধ্যমে।

📖

শব্দ

মাল্টিভেরিয়েট টেস্টিং

একই সময়ে একাধিক ভেরিয়েবল এবং তাদের সংমিশ্রণ পরীক্ষা করার উন্নত কৌশল যা সামগ্রিক অপ্টিমাইজেশন শনাক্ত করতে সাহায্য করে, মডেলের বিভিন্ন ফ্যাক্টরের মধ্যে ইন্টারঅ্যাকশন মূল্যায়ন করতে সক্ষম করে।

📖

শব্দ

ব্লু-গ্রিন ডিপ্লয়মেন্ট

দুটি অভিন্ন পরিবেশ সহ ডিপ্লয়মেন্ট প্যাটার্ন যেখানে সম্পূর্ণ ভ্যালিডেশনের পর ট্রাফিক পুরানো সংস্করণ (ব্লু) থেকে নতুন সংস্করণে (গ্রিন) সম্পূর্ণরূপে স্যুইচ হয়, ডাউনটাইম ন্যূনতম রাখে।

📖

শব্দ

ফিচার ফ্ল্যাগ

নিয়ন্ত্রণ ব্যবস্থা যা রিডিপ্লয়মেন্ট ছাড়াই নির্দিষ্ট কার্যকারিতা বা মডেলগুলি গতিশীলভাবে সক্রিয়/নিষ্ক্রিয় করতে দেয়, এক্সপেরিমেন্ট এবং দ্রুত রোলব্যাক সহজ করে।

📖

শব্দ

ট্রাফিক স্প্লিটিং

ইন্টেলিজেন্ট রাউটিং কৌশল যা কনফিগারযোগ্য নিয়ম অনুযায়ী মডেলের বিভিন্ন সংস্করণের মধ্যে অনুপাতিকভাবে রিকোয়েস্ট বন্টন করে এ/বি টেস্টিং বা ধাপে ধাপে ডিপ্লয়মেন্টের জন্য।

📖

শব্দ

স্ট্যাটিস্টিক্যাল সিগনিফিক্যান্স

সম্ভাব্যতা ভিত্তিক পরিমাপ যা নির্ধারণ করে যে পরীক্ষিত ভেরিয়েন্টগুলির মধ্যে পর্যবেক্ষিত পার্থক্যগুলি দৈবচয়নের পরিবর্তে প্রকৃত প্রভাবের কারণে কিনা, সাধারণত p-ভ্যালু < 0.05 থ্রেশহোল্ড সহ।

📖

শব্দ

P-ভ্যালু

নাল হাইপোথিসিস সত্য হলে পরিমাপ করা ফলাফলের কমপক্ষে সেই চরম পর্যবেক্ষণ করার সম্ভাবনা, যা হাইপোথিসিস টেস্টিংয়ে সিদ্ধান্তমূলক মানদণ্ড হিসেবে কাজ করে।

📖

শব্দ

কনফিডেন্স ইন্টারভাল

অনুমানকৃত মানের পরিসর যা একটি সংজ্ঞায়িত সম্ভাবনা (সাধারণত 95%) সহ পরিমাপ করা প্যারামিটারের প্রকৃত মান ধারণ করে, পরীক্ষামূলক অনুমানের অনিশ্চয়তা পরিমাপ করে।

📖

শব্দ

Control Group

Échantillon de population recevant la version de référence (généralement le modèle actuel) servant de baseline pour comparaison statistique avec les variantes expérimentales.

📖

শব্দ

Treatment Group

Segment de population exposé à la variante expérimentale du modèle ou traitement testé, permettant de mesurer l'impact relatif par rapport au groupe de contrôle.

📖

শব্দ

Baseline Model

Modèle de référence utilisé comme point de comparaison pour évaluer les améliorations apportées par de nouvelles versions, souvent le modèle actuellement en production.

📖

শব্দ

Champion-Challenger

Stratégie de compétition continue où le modèle champion actuel est constamment défié par des modèles challengers, le meilleur performer remplaçant progressivement le champion.

📖

শব্দ

Progressive Rollout

Déploiement incrémental d'un nouveau modèle avec augmentation graduelle du pourcentage de trafic, permettant une validation continue et une minimisation des risques d'impact négatif.

📖

শব্দ

Experimentation Platform

Infrastructure centralisée gérant le cycle de vie complet des expérimentations, de la création des variantes à l'analyse statistique des résultats et l'automatisation des décisions.

📖

শব্দ

Metric Drift

Phénomène de dégradation progressive des métriques de performance d'un modèle en production, détecté via le monitoring continu et nécessitant des réévaluations périodiques.

📖

শব্দ

Sample Size Calculation

Processus statistique déterminant le nombre minimum d'observations requis pour détecter une différence significative avec une puissance statistique donnée, essentiel pour la planification des tests.

📖

শব্দ

বেইজিয়ান এ/বি টেস্টিং

বিকল্পগুলির মূল্যায়নের জন্য বেইজিয়ান সম্ভাবনা ব্যবহার করে একটি বিকল্প পদ্ধতি, যা ছোট নমুনা সহ ধারাবাহিক সিদ্ধান্ত নেওয়া এবং ফলাফলের স্বজ্ঞাত ব্যাখ্যা সম্ভব করে।

📖

শব্দ

সিকোয়েন্সিয়াল টেস্টিং

প্রিসেট ব্যবধানে ফলাফল মূল্যায়নের অনুমতি দেয় এমন বিশ্লেষণ পদ্ধতি, টাইপ I ত্রুটি ঝুঁকি বৃদ্ধি ছাড়াই, পরীক্ষার সময়কাল এবং খরচ অপ্টিমাইজ করে।

এআই গ্লসারি

এ/বি টেস্টিং

মাল্টিভেরিয়েট টেস্টিং

ব্লু-গ্রিন ডিপ্লয়মেন্ট

ফিচার ফ্ল্যাগ

ট্রাফিক স্প্লিটিং

স্ট্যাটিস্টিক্যাল সিগনিফিক্যান্স

P-ভ্যালু

কনফিডেন্স ইন্টারভাল

Control Group

Treatment Group

Baseline Model

Champion-Challenger

Progressive Rollout

Experimentation Platform

Metric Drift

Sample Size Calculation

বেইজিয়ান এ/বি টেস্টিং

সিকোয়েন্সিয়াল টেস্টিং

কোন ফলাফল পাওয়া যায়নি