এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
Precision@K
Kটি প্রথম সুপারিশের মধ্যে প্রাসঙ্গিক আইটেমের অনুপাত পরিমাপকারী মেট্রিক, সর্বোচ্চ র্যাঙ্ক করা ফলাফলের গুণমান মূল্যায়নের জন্য অপরিহার্য।
Recall@K
Kটি প্রথম সুপারিশের মধ্যে কার্যকরভাবে উপস্থিত প্রাসঙ্গিক আইটেমের অনুপাত গণনা করে মোট উপলব্ধ প্রাসঙ্গিক আইটেমের সাথে তুলনা করে।
Mean Average Precision (MAP)
প্রতিটি প্রাসঙ্গিক অবস্থানে নির্ভুলতার গড় গণনা করে সমষ্টিগত মেট্রিক, সুপারিশ তালিকায় প্রতিটি প্রাসঙ্গিক আইটেমের র্যাঙ্ক দ্বারা ওজনযুক্ত।
NDCG (Normalized Discounted Cumulative Gain)
তালিকার শুরুতে দূরে স্থাপন করা প্রাসঙ্গিক আইটেমগুলিকে শাস্তি দিয়ে র্যাঙ্কিংয়ের গুণমান মূল্যায়নকারী স্বাভাবিকীকৃত স্কোর, গ্রেডেড প্রাসঙ্গিকতা সহ সুপারিশের জন্য আদর্শ।
RMSE (Root Mean Square Error)
ভবিষ্যদ্বাণী করা এবং প্রকৃত মানের মধ্যে পার্থক্য পরিমাপ করে রেটিং ভবিষ্যদ্বাণীর নির্ভুলতা মূল্যায়নের জন্য ব্যবহৃত গড় বর্গ ত্রুটি।
Hit Rate (HR)
Nটি প্রথম সুপারিশের মধ্যে কমপক্ষে একটি প্রাসঙ্গিক আইটেম উপস্থিত থাকা সেশনের শতাংশ, সিস্টেমের সামগ্রিক কার্যকারিতা পরিমাপ করে।
Catalog Coverage
সিস্টেম দ্বারা সুপারিশ করা যেতে পারে এমন ক্যাটালগের অনন্য আইটেমের শতাংশ, আইটেমের একটি সীমিত উপসেটে ঘনত্ব এড়ানোর জন্য গুরুত্বপূর্ণ।
Intra-List Diversity
একই সুপারিশ তালিকার আইটেমগুলির মধ্যে গড় অসাদৃশ্য পরিমাপ, অতিরিক্ততা এড়ানো এবং ব্যবহারকারীর অভিজ্ঞতা সমৃদ্ধ করার জন্য অপরিহার্য।
নভেলটি
ব্যবহারকারীর জন্য সুপারিশকৃত আইটেমগুলির অপরিচিততার মাত্রা, যা ক্যাটালগে তাদের সামগ্রিক জনপ্রিয়তার বিপরীত হিসাবে গণনা করা হয়।
সেরেন্ডিপিটি
সিস্টেমের এমন প্রাসঙ্গিক কিন্তু অপ্রত্যাশিত আইটেম সুপারিশ করার ক্ষমতা যা সাধারণ পূর্বাভাসের বাইরে গিয়ে ব্যবহারকারীকে ইতিবাচকভাবে অবাক করে।
এ/বি টেস্টিং
ব্যবসায়িক প্রভাব পরিমাপের জন্য বাস্তব ব্যবহারকারীদের সেগমেন্টে সিস্টেমের দুটি সংস্করণের কর্মক্ষমতা তুলনা করে পরীক্ষামূলক পদ্ধতি।
লিভ-ওয়ান-আউট ক্রস-ভ্যালিডেশন
শক্তিশালী মূল্যায়ন কৌশল যেখানে প্রতিটি ব্যবহারকারী ইন্টারঅ্যাকশন পর্যায়ক্রমে টেস্ট ডেটা হিসাবে ব্যবহৃত হয় যখন অন্যান্যগুলি প্রশিক্ষণের জন্য কাজ করে।
অফলাইন বনাম অনলাইন মূল্যায়ন
ঐতিহাসিক ডেটা (অফলাইন) এবং বাস্তব ইন্টারঅ্যাকশন (অনলাইন) সহ কর্মক্ষমতা মূল্যায়ন করে সিস্টেমের সম্পূর্ণ কার্যকারিতা যাচাই করার দ্বৈত পদ্ধতি।
টেম্পোরাল জেনারেলাইজেশন
ভবিষ্যতের ডেটায় এর কর্মক্ষমতা বজায় রাখার সিস্টেমের ক্ষমতা, যা এলোমেলো বিভাজনের পরিবর্তে সময়গত বিভাজনে অনুক্রমিকভাবে মূল্যায়ন করা হয়।
বিজনেস মেট্রিক্স কোরিলেশন
অ্যালগরিদমিক মেট্রিক্স (এনডিসিজি, প্রিসিশন) এবং ব্যবসায়িক সূচক (রূপান্তর, ধারণ) এর মধ্যে সম্পর্ক বিশ্লেষণ করে ব্যবসায়িক প্রাসঙ্গিকতা যাচাই করা।
ক্যাটার্যাক্ট মেট্রিক
সুপারিশের সামগ্রিক গুণমান সম্পূর্ণভাবে মূল্যায়ন করার জন্য নির্ভুলতা, বৈচিত্র্য, নতুনত্ব এবং কভারেজের ভারসাম্য রেখে যৌগিক স্কোর।
প্রত্যাশিত পারস্পরিক র্যাঙ্ক (ERR)
ব্যবহারকারীর আচরণের উপর ভিত্তি করে সম্ভাব্যতা মডেল যা প্রথম ক্লিকের পর পরীক্ষা বন্ধ হওয়ার ধারণা করে, প্রথম অবস্থানগুলিকে বেশি ওজন দেয়।
ব্যবহারকারী কভারেজ
যেসব ব্যবহারকারীর জন্য সিস্টেম সুপারিশ তৈরি করতে পারে তাদের শতাংশ, সিস্টেমের সার্বজনীন প্রযোজ্যতা পরিমাপের জন্য গুরুত্বপূর্ণ।
ন্যায্যতা মেট্রিক্স
বিভিন্ন জনসংখ্যাগত গোষ্ঠীর মধ্যে সুপারিশ বিতরণের ন্যায্যতা মূল্যায়নকারী সূচক, অ্যালগরিদমিক পক্ষপাত এড়ানোর জন্য।
এক্সপোজার পক্ষপাত পরিমাপ
জনপ্রিয় আইটেম এবং লং টেইল আইটেমের মধ্যে এক্সপোজারের পার্থক্যের পরিমাপ, সুপারিশের ভারসাম্য মূল্যায়নের জন্য অপরিহার্য।