রিয়েল-টাইম রিইনফোর্সমেন্ট লার্নিং
অ্যাসিঙ্ক্রোনাস শক্তিবৃদ্ধি শিক্ষণ
একটি আর্কিটেকচার যেখানে একাধিক এজেন্ট বা থ্রেড স্বাধীনভাবে পরিবেশ অন্বেষণ করে এবং একটি ভাগ করা মডেলকে অ্যাসিঙ্ক্রোনাসভাবে আপডেট করে। এই পদ্ধতিটি বাস্তব সময়ের শিক্ষণের জন্য গণনামূলক সম্পদের ব্যবহার সর্বাধিক করে।
← ফিরে যান