Évaluation de Systèmes de Recommandation - কৃত্রিম বুদ্ধিমত্তা শব্দাবলী

📖

শব্দ

Precision@K

Kটি প্রথম সুপারিশের মধ্যে প্রাসঙ্গিক আইটেমের অনুপাত পরিমাপকারী মেট্রিক, সর্বোচ্চ র্যাঙ্ক করা ফলাফলের গুণমান মূল্যায়নের জন্য অপরিহার্য।

📖

শব্দ

Recall@K

Kটি প্রথম সুপারিশের মধ্যে কার্যকরভাবে উপস্থিত প্রাসঙ্গিক আইটেমের অনুপাত গণনা করে মোট উপলব্ধ প্রাসঙ্গিক আইটেমের সাথে তুলনা করে।

📖

শব্দ

Mean Average Precision (MAP)

প্রতিটি প্রাসঙ্গিক অবস্থানে নির্ভুলতার গড় গণনা করে সমষ্টিগত মেট্রিক, সুপারিশ তালিকায় প্রতিটি প্রাসঙ্গিক আইটেমের র্যাঙ্ক দ্বারা ওজনযুক্ত।

📖

শব্দ

NDCG (Normalized Discounted Cumulative Gain)

তালিকার শুরুতে দূরে স্থাপন করা প্রাসঙ্গিক আইটেমগুলিকে শাস্তি দিয়ে র্যাঙ্কিংয়ের গুণমান মূল্যায়নকারী স্বাভাবিকীকৃত স্কোর, গ্রেডেড প্রাসঙ্গিকতা সহ সুপারিশের জন্য আদর্শ।

📖

শব্দ

RMSE (Root Mean Square Error)

ভবিষ্যদ্বাণী করা এবং প্রকৃত মানের মধ্যে পার্থক্য পরিমাপ করে রেটিং ভবিষ্যদ্বাণীর নির্ভুলতা মূল্যায়নের জন্য ব্যবহৃত গড় বর্গ ত্রুটি।

📖

শব্দ

Hit Rate (HR)

Nটি প্রথম সুপারিশের মধ্যে কমপক্ষে একটি প্রাসঙ্গিক আইটেম উপস্থিত থাকা সেশনের শতাংশ, সিস্টেমের সামগ্রিক কার্যকারিতা পরিমাপ করে।

📖

শব্দ

Catalog Coverage

সিস্টেম দ্বারা সুপারিশ করা যেতে পারে এমন ক্যাটালগের অনন্য আইটেমের শতাংশ, আইটেমের একটি সীমিত উপসেটে ঘনত্ব এড়ানোর জন্য গুরুত্বপূর্ণ।

📖

শব্দ

Intra-List Diversity

একই সুপারিশ তালিকার আইটেমগুলির মধ্যে গড় অসাদৃশ্য পরিমাপ, অতিরিক্ততা এড়ানো এবং ব্যবহারকারীর অভিজ্ঞতা সমৃদ্ধ করার জন্য অপরিহার্য।

📖

শব্দ

নভেলটি

ব্যবহারকারীর জন্য সুপারিশকৃত আইটেমগুলির অপরিচিততার মাত্রা, যা ক্যাটালগে তাদের সামগ্রিক জনপ্রিয়তার বিপরীত হিসাবে গণনা করা হয়।

📖

শব্দ

সেরেন্ডিপিটি

সিস্টেমের এমন প্রাসঙ্গিক কিন্তু অপ্রত্যাশিত আইটেম সুপারিশ করার ক্ষমতা যা সাধারণ পূর্বাভাসের বাইরে গিয়ে ব্যবহারকারীকে ইতিবাচকভাবে অবাক করে।

📖

শব্দ

এ/বি টেস্টিং

ব্যবসায়িক প্রভাব পরিমাপের জন্য বাস্তব ব্যবহারকারীদের সেগমেন্টে সিস্টেমের দুটি সংস্করণের কর্মক্ষমতা তুলনা করে পরীক্ষামূলক পদ্ধতি।

📖

শব্দ

লিভ-ওয়ান-আউট ক্রস-ভ্যালিডেশন

শক্তিশালী মূল্যায়ন কৌশল যেখানে প্রতিটি ব্যবহারকারী ইন্টারঅ্যাকশন পর্যায়ক্রমে টেস্ট ডেটা হিসাবে ব্যবহৃত হয় যখন অন্যান্যগুলি প্রশিক্ষণের জন্য কাজ করে।

📖

শব্দ

অফলাইন বনাম অনলাইন মূল্যায়ন

ঐতিহাসিক ডেটা (অফলাইন) এবং বাস্তব ইন্টারঅ্যাকশন (অনলাইন) সহ কর্মক্ষমতা মূল্যায়ন করে সিস্টেমের সম্পূর্ণ কার্যকারিতা যাচাই করার দ্বৈত পদ্ধতি।

📖

শব্দ

টেম্পোরাল জেনারেলাইজেশন

ভবিষ্যতের ডেটায় এর কর্মক্ষমতা বজায় রাখার সিস্টেমের ক্ষমতা, যা এলোমেলো বিভাজনের পরিবর্তে সময়গত বিভাজনে অনুক্রমিকভাবে মূল্যায়ন করা হয়।

📖

শব্দ

বিজনেস মেট্রিক্স কোরিলেশন

অ্যালগরিদমিক মেট্রিক্স (এনডিসিজি, প্রিসিশন) এবং ব্যবসায়িক সূচক (রূপান্তর, ধারণ) এর মধ্যে সম্পর্ক বিশ্লেষণ করে ব্যবসায়িক প্রাসঙ্গিকতা যাচাই করা।

📖

শব্দ

ক্যাটার্যাক্ট মেট্রিক

সুপারিশের সামগ্রিক গুণমান সম্পূর্ণভাবে মূল্যায়ন করার জন্য নির্ভুলতা, বৈচিত্র্য, নতুনত্ব এবং কভারেজের ভারসাম্য রেখে যৌগিক স্কোর।

📖

শব্দ

প্রত্যাশিত পারস্পরিক র‌্যাঙ্ক (ERR)

ব্যবহারকারীর আচরণের উপর ভিত্তি করে সম্ভাব্যতা মডেল যা প্রথম ক্লিকের পর পরীক্ষা বন্ধ হওয়ার ধারণা করে, প্রথম অবস্থানগুলিকে বেশি ওজন দেয়।

📖

শব্দ

ব্যবহারকারী কভারেজ

যেসব ব্যবহারকারীর জন্য সিস্টেম সুপারিশ তৈরি করতে পারে তাদের শতাংশ, সিস্টেমের সার্বজনীন প্রযোজ্যতা পরিমাপের জন্য গুরুত্বপূর্ণ।

📖

শব্দ

ন্যায্যতা মেট্রিক্স

বিভিন্ন জনসংখ্যাগত গোষ্ঠীর মধ্যে সুপারিশ বিতরণের ন্যায্যতা মূল্যায়নকারী সূচক, অ্যালগরিদমিক পক্ষপাত এড়ানোর জন্য।

📖

শব্দ

এক্সপোজার পক্ষপাত পরিমাপ

জনপ্রিয় আইটেম এবং লং টেইল আইটেমের মধ্যে এক্সপোজারের পার্থক্যের পরিমাপ, সুপারিশের ভারসাম্য মূল্যায়নের জন্য অপরিহার্য।

এআই গ্লসারি

Precision@K

Recall@K

Mean Average Precision (MAP)

NDCG (Normalized Discounted Cumulative Gain)

RMSE (Root Mean Square Error)

Hit Rate (HR)

Catalog Coverage

Intra-List Diversity

নভেলটি

সেরেন্ডিপিটি

এ/বি টেস্টিং

লিভ-ওয়ান-আউট ক্রস-ভ্যালিডেশন

অফলাইন বনাম অনলাইন মূল্যায়ন

টেম্পোরাল জেনারেলাইজেশন

বিজনেস মেট্রিক্স কোরিলেশন

ক্যাটার্যাক্ট মেট্রিক

প্রত্যাশিত পারস্পরিক র‌্যাঙ্ক (ERR)

ব্যবহারকারী কভারেজ

ন্যায্যতা মেট্রিক্স

এক্সপোজার পক্ষপাত পরিমাপ

কোন ফলাফল পাওয়া যায়নি