এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
ডিফারেনশিয়েবল মডেল-ভিত্তিক আরএল
পুনর্বলিত শিক্ষার একটি পদ্ধতি যেখানে পরিবেশের একটি ডিফারেনশিয়েবল মডেলের মাধ্যমে গ্রেডিয়েন্ট ব্যাকপ্রোপাগেট করা হয় সরাসরি নীতিমালা অপ্টিমাইজ করার জন্য।
নিউরাল নেটওয়ার্ক ডায়নামিক্স মডেল
নিউরাল নেটওয়ার্ক যা কর্মের উপর ভিত্তি করে পরিবেশের অবস্থার বিবর্তন ভবিষ্যদ্বাণী করতে প্রশিক্ষিত, ডিফারেনশিয়েবল সিমুলেশন সম্ভব করে।
ডিফারেনশিয়েবল অপ্টিমাইজেশন
একটি কৌশল যেখানে অপ্টিমাইজেশন স্তরগুলি ডিফারেনশিয়েবল, নেস্টেড অপ্টিমাইজেশন প্রক্রিয়ার এন্ড-টু-এন্ড শিক্ষা সম্ভব করে।
কল্পিত অভিজ্ঞতা রিপ্লে
একটি ডিফারেনশিয়েবল মডেলের মাধ্যমে সিন্থেটিক ট্র্যাজেক্টরি তৈরি করা বাস্তবিক ইন্টারঅ্যাকশন ছাড়াই শিক্ষার অভিজ্ঞতা সমৃদ্ধ করার জন্য।
ডিফারেনশিয়েবল প্ল্যানিং
প্ল্যানিং অ্যালগরিদম যেখানে প্রতিটি ধাপ ডিফারেনশিয়েবল, গ্রেডিয়েন্ট ডিসেন্টের মাধ্যমে প্ল্যানের ক্রমাগত অপ্টিমাইজেশন সম্ভব করে।
ডিফারেনশিয়েবল সিমুলেটর
একটি সিমুলেশন পরিবেশ যা ডিফারেনশিয়েবল অপারেশন দিয়ে বাস্তবায়িত, পুরো সিমুলেশন জুড়ে গ্রেডিয়েন্ট গণনা সম্ভব করে।
মডেলের মাধ্যমে পলিসি গ্রেডিয়েন্ট
একটি পদ্ধতি যা একটি ডিফারেনশিয়েবল পরিবেশ মডেলের মাধ্যমে পুরস্কার প্রোপাগেট করে পলিসি গ্রেডিয়েন্ট গণনা করে।
ডিফারেনশিয়েবল পরিবেশ মডেল
পরিবেশ মডেল যা বিশেষভাবে তাদের অভ্যন্তরীণ অপারেশনের মাধ্যমে গ্রেডিয়েন্ট ব্যাকপ্রোপাগেশন সমর্থন করার জন্য ডিজাইন করা।
ভেদযোগ্য গেম ইঞ্জিন
জটিল পরিবেশে শক্তিশালী শেখার জন্য ডিফারেনশিয়েশন সমর্থন করতে পরিবর্তিত গেম ইঞ্জিন।
আরএলে নিউরাল ওডিই
ক্রমাগত পরিবেশের গতিবিদ্যা মডেল করার জন্য স্নায়বিক সাধারণ ডিফারেনশিয়াল সমীকরণের ব্যবহার ভেদযোগ্য উপায়ে।
ভেদযোগ্য কন্ট্রোল থিওরি
এন্ড-টু-এন্ড কন্ট্রোলার শেখার জন্য তাত্ত্বিক নিয়ন্ত্রণ নীতির প্রয়োগ ভেদযোগ্য উপায়ে বাস্তবায়িত।