এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
বিহেভিওরাল ক্লোনিং
বিশেষজ্ঞ প্রদর্শন এবং এজেন্টের কর্মের মধ্যে ত্রুটি কমানোর মাধ্যমে সরাসরি নীতি শেখা।
ইনভার্স রিইনফোর্সমেন্ট লার্নিং
বিশেষজ্ঞ প্রদর্শন থেকে পুরস্কার ফাংশন অনুমান করা এবং তারপর সর্বোত্তম নীতি শেখা।
জেনারেটিভ অ্যাডভারসারিয়াল ইমিটেশন লার্নিং
বিশেষজ্ঞ প্রদর্শন থেকে এজেন্টের আচরণ আলাদা করতে অ্যাডভারসারিয়াল নেটওয়ার্ক ব্যবহার।
ডেটা অ্যাগ্রিগেশন ডিএজার
বর্তমান নীতি দ্বারা পরিদর্শন করা রাজ্যগুলিতে বিশেষজ্ঞকে জিজ্ঞাসা করে পুনরাবৃত্তিমূলক ডেটা সংগ্রহ।
অফলাইন অনুকরণ শিক্ষা
পরিবেশের সাথে অতিরিক্ত মিথস্ক্রিয়া ছাড়াই একটি নির্দিষ্ট প্রদর্শন সেট থেকে শেখা।
অনলাইন অনুকরণ শিক্ষা
রিয়েল-টাইম ইন্টারঅ্যাকশন এবং নতুন প্রদর্শনীর উপর ভিত্তি করে আপডেটের সাথে অবিরত শিক্ষা।
পর্যবেক্ষণের মাধ্যমে অনুকরণ
বিশেষজ্ঞের কর্মকাণ্ডে প্রবেশাধিকার ছাড়াই শুধুমাত্র অবস্থা এবং পথ পর্যবেক্ষণ করে শেখা।
হায়ারার্কিকাল ইমিটেশন লার্নিং
জটিল কাজগুলিকে বিভিন্ন বিমূর্ততার স্তরে ইমিটেশন লার্নিং সহ উপ-কাজে বিভক্ত করা।
এক-শট ইমিটেশন লার্নিং
একটি প্রদর্শন দেখার পরে একটি নতুন কাজ অনুকরণ করার ক্ষমতা।
মেটা-অনুকরণ শিক্ষা
বহু কাজের অভিজ্ঞতার মাধ্যমে অনুকরণের মাধ্যমে নতুন কাজ দ্রুত শেখার শিক্ষা।
মাল্টিমোডাল অনুকরণ শেখা
একাধিক বৈধ সমাধান সহ বিক্ষোভ পরিচালনা এবং মাল্টিমোডাল নীতি শেখা।
আংশিক পর্যবেক্ষণ সহ অনুকরণ
যখন প্রদর্শনাগুলি কেবলমাত্র আংশিকভাবে অবস্থার স্থান জুড়ে থাকে তখন অনুকরণের মাধ্যমে শেখা।