এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
শ্যানন এনট্রপি
ডেটা সেটে অনিশ্চয়তা বা বিশৃঙ্খলার গাণিতিক পরিমাপ, যা সম্ভাব্যতার যোগফলকে তাদের ঋণাত্মক লগারিদম দ্বারা গুণ করে গণনা করা হয়। সিদ্ধান্ত বৃক্ষে নোডের অশুদ্ধতা পরিমাপের জন্য বিভাজন মানদণ্ড হিসেবে ব্যবহৃত হয়।
বিভাজন মানদণ্ড
সিদ্ধান্ত বৃক্ষের প্রতিটি নোডে সর্বোত্তম বৈশিষ্ট্য এবং বিভাজন সীমা নির্ধারণের জন্য ব্যবহৃত গাণিতিক নিয়ম, যা তথ্য লাভ সর্বাধিকীকরণ বা অশুদ্ধতা ন্যূনতমকরণের উপর ভিত্তি করে। চূড়ান্ত বৃক্ষের কাঠামো এবং পূর্বাভাসমূলক কার্যকারিতা নির্ধারণ করে।
শর্তাধীন এনট্রপি
একটি এলোমেলো চলক Y-এর উপর অবশিষ্ট অনিশ্চয়তার পরিমাপ যখন অন্য চলক X-এর মান জানা থাকে, যা তথ্য লাভ গণনার জন্য অপরিহার্য। X-এর প্রতিটি মানের জন্য Y-এর শর্তাধীন বন্টনের গড় এনট্রপি প্রতিনিধিত্ব করে।
তথ্য অনুপাত
তথ্য লাভের একটি স্বাভাবিকীকৃত রূপ যা এটিকে বিভাজন বৈশিষ্ট্যের অন্তর্নিহিত এনট্রপি দ্বারা ভাগ করে অনেক মানযুক্ত বৈশিষ্ট্যগুলির প্রতি পক্ষপাত এড়াতে। তথ্য লাভের স্বাভাবিক প্রবণতাকে ক্ষতিপূরণ করে যা অত্যন্ত সূক্ষ্ম বৈশিষ্ট্যগুলিকে পক্ষপাত করে।
এমডিএল নীতি
ন্যূনতম বর্ণনা দৈর্ঘ্য নীতি যা মডেলের জটিলতা এবং ফিটের গুণমানের মধ্যে ভারসাম্য বজায় রাখতে তথ্য তত্ত্ব ব্যবহার করে, তাদের বর্ণনামূলক খরচের তুলনায় পর্যাপ্ত তথ্য না আনা বিভাজনগুলিকে শাস্তি দেয়। বিশুদ্ধ বিভাজন মানদণ্ডের একটি বিকল্প নিয়মিতকরণ।
এনট্রপি-ভিত্তিক প্রুনিং
পোস্ট-প্রুনিং কৌশল যা একটি শাখা অপসারণ মডেলের বায়াস-ভ্যারিয়েন্স ট্রেডঅফ উন্নত করে কিনা তা মূল্যায়নের জন্য এনট্রপিক মানদণ্ড ব্যবহার করে। সম্ভাব্য তথ্য লাভকে অতিরিক্ত জটিলতার খরচের সাথে তুলনা করে।
যৌথ এনট্রপি
একই সাথে একাধিক এলোমেলো চলক নিয়ে গঠিত একটি সিস্টেমের মোট অনিশ্চয়তার পরিমাপ, সিদ্ধান্ত বৃক্ষ গঠনে বৈশিষ্ট্যগুলির মধ্যে সম্পর্ক বোঝার জন্য মৌলিক। পারস্পরিক তথ্য গণনায় ব্যবহৃত হয়।
লাভ অনুপাত
উচ্চ কার্ডিনালিটি সহ বৈশিষ্ট্যগুলির প্রতি পক্ষপাত সংশোধনের জন্য পার্টিশন এনট্রপি দ্বারা স্বাভাবিকীকৃত তথ্য লাভের পরিবর্তন, C4.5 অ্যালগরিদমে প্রবর্তিত। তথ্য লাভের সুবিধাগুলি বজায় রাখার সময় মানের সংখ্যার প্রতি তার সংবেদনশীলতা হ্রাস করে।
আপেক্ষিক তথ্য লাভ
প্রাথমিক এনট্রপির অনুপাত হিসাবে প্রকাশিত তথ্য লাভের স্বাভাবিক সংস্করণ, যা বিভিন্ন ডেটাসেট বা সমস্যার মধ্যে তুলনা করতে সক্ষম করে। বিভাজন কর্মক্ষমতার ব্যাখ্যা এবং বেঞ্চমার্কিং সহজ করে।
বাইনারি বিভাজন
প্রতিটি ধাপে ঠিক দুটি চাইল্ড নোড তৈরি করে এমন বিভাজন কৌশল, যা তথ্য লাভের গণনা সহজ করে এবং গাছের কাঠামোগত জটিলতা হ্রাস করে। মডেলের অভিব্যক্তিমূলক শক্তি সংরক্ষণ করার সময় গণনামূলক দক্ষতা অনুকূল করে।
মাল্টি-ওয়ে বিভাজন
নির্বাচিত বৈশিষ্ট্যের জন্য স্বতন্ত্র মান যতগুলি রয়েছে ততগুলি চাইল্ড নোড তৈরি করে এমন বিভাজন পদ্ধতি, যা সম্ভাব্যভাবে কাঁচা তথ্য লাভ সর্বাধিক করে। ওভারফিটিং এড়াতে প্রায়ই গেইন রেশিওর মতো নিয়মিতকরণ কৌশল প্রয়োজন।