অপ্টিমাইজেশনের জন্য রিইনফোর্সমেন্ট লার্নিং
ডিপ কিউ-নেটওয়ার্ক
একটি গভীর নিউরাল নেটওয়ার্ক আর্কিটেকচার যা জটিল স্টেট স্পেসে Q ফাংশন আনুমানিক করতে ব্যবহৃত হয়, গভীর শিক্ষণ এবং Q-লার্নিংকে একত্রিত করে।
← ফিরে যান