এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
ডায়না-কিউ শেখা
একটি হাইব্রিড অ্যালগরিদম যা সরাসরি শেখা এবং পরিকল্পনাকে একত্রিত করে, শেখা মডেল ব্যবহার করে সিমুলেটেড অভিজ্ঞতা তৈরি করতে।
মন্টে কার্লো ট্রি সার্চ পরিকল্পনা
সিদ্ধান্ত বৃক্ষ অন্বেষণ অ্যালগরিদম যা মডেলকৃত পরিবেশে ভবিষ্যত ক্রিয়াগুলি মূল্যায়নের জন্য এলোমেলো সিমুলেশন ব্যবহার করে।
কল্পনাশক্তি দ্বারা শেখা
বাস্তবিক মিথস্ক্রিয়া ছাড়াই মানসিকভাবে পরিস্থিতি সিমুলেট করতে অভ্যন্তরীণ মডেল ব্যবহার করে শেখার গতি বাড়ানোর কৌশল।
World Models
আর্কিটেকচার যা পরিবেশের একটি সংকুচিত উপস্থাপনা এবং একটি লুকানো স্থানে পরিকল্পনার জন্য একটি রূপান্তর মডেল শেখে।
মডেল এনসেম্বল শেখা
অনিশ্চয়তা পরিমাপ করতে এবং সিদ্ধান্তের দৃঢ়তা উন্নত করতে একাধিক শেখা মডেল ব্যবহার করে এমন পদ্ধতি।
মডেল ডিফারেন্সিয়েশন শেখা
একটি ডিফারেন্সিয়েবল পরিবেশ মডেলের মাধ্যমে গ্রেডিয়েন্ট পাঠিয়ে সরাসরি নীতিগুলি অপ্টিমাইজ করার পদ্ধতি।
মডেল-ভিত্তিক কৌতূহল-চালিত শেখা
পরিবেশ অন্বেষণে নির্দেশনা দেওয়ার জন্য মডেলের পূর্বাভাস ত্রুটিকে অন্তর্নিহিত সংকেত হিসেবে ব্যবহার করে এমন একটি ব্যবস্থা।
মডেল-ভিত্তিক শ্রেণীবদ্ধ শিক্ষা
দীর্ঘ সময়সীমার জন্য কার্যকর পরিকল্পনার জন্য বিভিন্ন সময় স্কেলে মডেলগুলির সমন্বয়ে বহু-স্তরীয় কাঠামো।
ট্র্যাজেক্টরি প্রেডিকশন লার্নিং
প্রেডিক্টিভ মডেল যা কর্মের ফলাফল মূল্যায়নের জন্য ভবিষ্যত অবস্থার ক্রম পূর্বাভাস দেওয়ার জন্য শেখে।
ট্রান্সফার লার্নিং মডেল-ভিত্তিক শেখা
একটি কৌশল যা অনুরূপ পরিবেশের মধ্যে মডেলের জ্ঞান স্থানান্তর করে নতুন কাজে অভিযোজন ত্বরান্বিত করে।
MuZero
একটি উন্নত অ্যালগরিদম যা পরিবর্তন, প্রতিক্রিয়া এবং মান মডেল একইসাথে শেখে, গতিবিদ্যার পূর্বজ্ঞান ছাড়াই।
সক্রিয় শিক্ষার মাধ্যমে শিক্ষা
মডেলের শিক্ষার দক্ষতা উন্নত করতে সবচেয়ে তথ্যপূর্ণ অভিজ্ঞতাগুলি সক্রিয়ভাবে নির্বাচন করার কৌশল।