এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
সক্রিয় শিক্ষণ
একটি আধা-তত্ত্বাবধানাধীন শিক্ষণ প্যারাডাইম যেখানে অ্যালগরিদম পুনরাবৃত্তিমূলকভাবে সবচেয়ে তথ্যপূর্ণ উদাহরণগুলো নির্বাচন করে এনোটেশন করার জন্য, যার মাধ্যমে শিক্ষণের খরচ-কার্যকারিতা অনুপাত অপ্টিমাইজ করা হয়।
অন্বেষণ-ব্যবহারের ট্রেড-অফ
পুনর্বলন শিক্ষণে একটি মৌলিক দ্বিধা যা নতুন তথ্য অর্জন (অন্বেষণ) এবং বিদ্যমান জ্ঞান ব্যবহার (ব্যবহার) এর মধ্যে ভারসাম্য বজায় রাখতে গঠিত।
ঘনত্ব-ভিত্তিক নমুনায়ন
একটি সক্রিয় নমুনায়ন পদ্ধতি যা আউটলায়ার এড়াতে এবং প্রতিনিধিত্বমূলক অঞ্চলে মনোনিবেশ করার জন্য অনিশ্চয়তা এবং উদাহরণগুলোর ঘনত্ব উভয়ই বিবেচনা করে।
ফরওয়ার্ড মডেল
একটি পূর্বাভাসমূলক মডেল যা বর্তমান অবস্থা এবং ক্রিয়া দেওয়া হলে পরবর্তী অবস্থা এবং পুরস্কার অনুমান করে, পুনর্বলন শিক্ষণে পরিকল্পনার জন্য মৌলিক।
ইনভার্স মডেল
একটি মডেল যা শেখে যে কোন ক্রিয়া একটি বিশেষ অবস্থা পরিবর্তনের দিকে নিয়ে গেছে, অনুকরণ শিক্ষণ এবং কার্যকারণ বোঝার জন্য উপযোগী।
পরিকল্পনা মডিউল
একটি অ্যালগরিদমিক উপাদান যা শেখা মডেল ব্যবহার করে ভবিষ্যতের ট্র্যাজেক্টরি সিমুলেট করে এবং প্রকৃত এক্সিকিউশনের আগে নীতিমালা অপ্টিমাইজ করে।
সক্রিয় অন্বেষণ
একটি ইচ্ছাকৃত অন্বেষণ কৌশল যা সক্রিয়ভাবে সেই ক্রিয়াগুলো নির্বাচন করে যা পরিবেশ বা নীতিমালা সম্পর্কে অর্জিত তথ্য সর্বাধিক করে।