ভেরিয়েশনাল মডেল
নিয়ন্ত্রণ এজেন্ট (Controller)
অ্যাকশন সিদ্ধান্ত গ্রহণকারী পলিসি বা নিউরাল নেটওয়ার্ক, যা ওয়ার্ল্ড মডেলের ক্ষেত্রে, প্রকৃত পরিবেশ থেকে নয় বরং ল্যাটেন্ট স্পেসে উৎপন্ন অভিজ্ঞতা ব্যবহার করে প্রশিক্ষিত হয়।
← ফিরে যান