এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
বন্টনমূলক মান ফাংশন
মান ফাংশনগুলিকে স্কেলারের পরিবর্তে সম্পূর্ণ বন্টন হিসেবে মডেল করা।
Categorical DQN
অ্যালগরিদম যা রিটার্নের বন্টনের একটি বিচ্ছিন্ন শ্রেণীবদ্ধ উপস্থাপনা ব্যবহার করে।
কোয়ান্টাইল রিগ্রেশন ডিকিউএন
বিতরণের কোয়ান্টাইল সরাসরি শেখার জন্য কোয়ান্টাইল রিগ্রেশন পদ্ধতি ব্যবহার করে।
ঝুঁকি-সচেতন শিক্ষণ
ঝুঁকি পছন্দ মডেল করার জন্য সম্পূর্ণ বন্টন ব্যবহার।
নীতির বন্টনমূলক গ্রেডিয়েন্ট
নীতির গ্রেডিয়েন্ট পদ্ধতিগুলির বন্টনমূলক পদ্ধতিতে সম্প্রসারণ।
অনিশ্চয়তার অনুমান
ফেরতের বণ্টনের মাধ্যমে পূর্বাভাসে অনিশ্চয়তার পরিমাপ।
RL ডিস্ট্রিবিউশনাল মাল্টি-পাস
স্থিতিশীলতা উন্নত করার জন্য ডিস্ট্রিবিউশনাল ফ্রেমওয়ার্কে মাল্টি-পাস পদ্ধতির সম্প্রসারণ।
RL বিতরণমূলক অবিচ্ছিন্ন
অবিচ্ছিন্ন কর্মস্থানে বিতরণমূলক পদ্ধতির প্রয়োগ।
অভিনেতা-সমালোচক বিতরণমূলক
অভিনেতা-সমালোচক পদ্ধতির সাথে বিতরণমূলক পদ্ধতির সমন্বয়।
RL Basé sur Modèle Distributionnel
Intégration des distributions dans les méthodes d'apprentissage par renforcement basées sur modèle.
RL হায়ারার্কিকাল ডিস্ট্রিবিউশনাল
ডিসিশন হায়ারার্কির স্ট্রাকচারে ডিস্ট্রিবিউশনাল কনসেপ্টের প্রয়োগ।
Transfert d'Apprentissage Distributionnel
Utilisation des distributions pour améliorer le transfert de connaissances entre tâches.