এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
রিটার্ন বন্টন
ভবিষ্যতের ডিসকাউন্টেড পুরস্কারের যোগফলের সম্পূর্ণ সম্ভাব্যতা উপস্থাপনা, যা একটি একক প্রত্যাশিত মানের পরিবর্তে সমস্ত সম্ভাব্য পরিস্থিতি ধারণ করে।
কোয়ান্টাইল বন্টন
পুরস্কারের পরিবর্তনশীলতা এবং বন্টনের লেজগুলো ধারণ করার জন্য রিটার্ন বন্টনের কোয়ান্টাইলগুলিকে সরাসরি মডেলিং করার পদ্ধতি।
মান-শর্তাধীন ঝুঁকি
একটি নির্দিষ্ট কোয়ান্টাইলের বাইরে বন্টনের নিম্ন লেজে রিটার্নের প্রত্যাশা গণনা করে এমন একটি শক্তিশালী ঝুঁকি পরিমাপ।
অন্তর্নিহিত বন্টন
সাধারণত জেনারেটিভ নিউরাল নেটওয়ার্ক বা স্যাম্পলারগুলির মাধ্যমে স্পষ্ট প্যারামিটার ছাড়াই পরোক্ষভাবে শেখা বন্টনমূলক উপস্থাপনা।
রিটার্নের ভ্যারিয়েন্স
তাদের প্রত্যাশার সাপেক্ষে রিটার্নের গড় বর্গীয় বিচ্যুতি পরিমাপ করে, যা সিদ্ধান্ত গ্রহণে ঝুঁকির একটি মূল সূচক।
পলিসি এনট্রপি
এজেন্টের কর্মের অনিশ্চয়তার পরিমাপ, যা স্টেট-অ্যাকশন স্পেস অন্বেষণ এবং আচরণগত অনিশ্চয়তা পরিমাপ করতে ব্যবহৃত হয়।
কনফিডেন্স বাউন্ড
পূর্বনির্ধারিত সম্ভাবনা সহ গ্যারান্টিযুক্ত পরিসংখ্যানগত ব্যবধান যা নিশ্চিত করে যে প্রকৃত মান অনুমানকৃত পরিসরের মধ্যে রয়েছে, নিরাপদ অন্বেষণের জন্য অপরিহার্য।
ক্রেমার বন্টন
গাউসিয়ান অনুমানের বাইরে রিটার্নগুলিতে অসমতা এবং ভারী লেজ মডেল করার অনুমতি দেয় এমন নমনীয় বন্টনের পরিবার।
কার্নেল অনুমান
অভিজ্ঞতামূলক পর্যবেক্ষণগুলিকে মসৃণ করতে কার্নেল ফাংশন ব্যবহার করে রিটার্নের সম্ভাব্যতা ঘনত্ব অনুমান করার একটি প্যারামিটারবিহীন পদ্ধতি।
অনিশ্চয়তার বিস্তার
পর্যবেক্ষণ থেকে চূড়ান্ত সিদ্ধান্ত পর্যন্ত রিইনফোর্সমেন্ট লার্নিংয়ের ধারাবাহিক ধাপগুলির মাধ্যমে অনিশ্চয়তা প্রেরণের প্রক্রিয়া।
ভ্যারিয়েশনাল আনুমানিক
জটিল বন্টনগুলিকে সরল পরিবার দ্বারা আনুমানিক করার একটি অপ্টিমাইজেশন পদ্ধতি, যা বন্টনগুলির মধ্যে ডাইভারজেন্স হ্রাস করে।
মিশ্রণ বন্টন
একাধিক মৌলিক বন্টনের ওজনযুক্ত সংমিশ্রণ, যা প্রত্যাশিত রিটার্নে বহুমুখী আচরণ ক্যাপচার করতে সক্ষম।
ক্রমবর্ধমান বন্টন ফাংশন
F(x) ফাংশন যা রিটার্ন x-এর চেয়ে কম বা সমান হওয়ার সম্ভাবনা দেয়, রিটার্নের বন্টনকে সম্পূর্ণরূপে চিহ্নিত করে।
বায়াস-ভ্যারিয়েন্স ট্রেডঅফ
বন্টনমূলক অনুমানে মডেলের জটিলতা (উচ্চ ভ্যারিয়েন্স, নিম্ন বায়াস) এবং এর সরলতা (নিম্ন ভ্যারিয়েন্স, উচ্চ বায়াস) এর মধ্যে মৌলিক দ্বিধা।