এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
ওজনযুক্ত রৈখিক স্কেলারাইজেশন
একাধিক উদ্দেশ্য সমস্যাকে একটি একক উদ্দেশ্যে হ্রাস করার জন্য রৈখিক ওজন দ্বারা উদ্দেশ্যগুলি সমন্বয় করার পদ্ধতি।
Front de Pareto
Ensemble des solutions optimales non-dominées où aucun objectif ne peut être amélioré sans en dégrader un autre.
সীমাবদ্ধতা সহ শক্তিশালীকরণ শিক্ষা
অন্যান্য উদ্দেশ্যে সীমাবদ্ধতা মেনে চলার সময় একটি প্রধান উদ্দেশ্য অপ্টিমাইজ করার পদ্ধতি।
সমঝোতার পদ্ধতি
নির্দিষ্ট পছন্দ অনুযায়ী পরস্পরবিরোধী লক্ষ্যগুলোর মধ্যে স্পষ্টভাবে ভারসাম্য রক্ষাকারী কৌশল।
Q-Learning বহুবস্তু
Q-Learning অ্যালগরিদমের সম্প্রসারণ যা স্কেলার মানের পরিবর্তে পুরস্কার ভেক্টর পরিচালনা করে।
মাল্টি-অবজেক্টিভ ইভোলিউশনারি অপ্টিমাইজেশন
প্যারেটো ফ্রন্ট এক্সপ্লোর করার জন্য ইভোলিউশনারি অ্যালগরিদমের সাথে আরএল-এর সমন্বয়।
মাল্টি-অবজেক্টিভ হায়ারার্কিক্যাল রিইনফোর্সমেন্ট লার্নিং
হায়ারার্কিক্যাল স্ট্রাকচার যেখানে বিভিন্ন স্তর বিভিন্ন উদ্দেশ্য বা উদ্দেশ্যের সংমিশ্রণ পরিচালনা করে।
বহু-উদ্দেশ্য নীতি
বিভিন্ন উদ্দেশ্যের মধ্যে সমন্বয় অনুযায়ী সর্বোত্তম কর্ম উৎপাদনকারী সিদ্ধান্ত ব্যবস্থা।
মাল্টি-অবজেক্টিভ ভ্যালু ফাংশন
সমস্ত উদ্দেশ্য একসাথে বিবেচনা করে অবস্থা বা কর্মের ভেক্টর উপস্থাপনা।
ডিপ আরএল মাল্টি-অবজেক্টিভস
জটিল মাল্টি-অবজেক্টিভ সমাধান আনুমানিক করার জন্য গভীর নিউরাল নেটওয়ার্কের প্রয়োগ।
লক্ষ্যের স্থান অন্বেষণ
প্যারেটো ফ্রন্ট আবিষ্কারের জন্য নকশাকৃত অন্বেষণ কৌশল।
মাল্টি-এজেন্ট মাল্টি-অবজেক্টিভ রিইনফোর্সমেন্ট লার্নিং
মাল্টি-এজেন্টে সম্প্রসারণ যেখানে প্রতিটি এজেন্ট বা সমষ্টিগত সিস্টেম একাধিক উদ্দেশ্য অপ্টিমাইজ করে।
বহু-উদ্দেশ্য নীতিমালার মূল্যায়ন
বহু-উদ্দেশ্য সমাধানগুলি মূল্যায়ন ও তুলনা করার জন্য নির্দিষ্ট মেট্রিক্স এবং পদ্ধতি।
পন্ডারনের গতিশীল অভিযোজন
শিক্ষার সময় স্বয়ংক্রিয়ভাবে উদ্দেশ্যগুলির আপেক্ষিক গুরুত্ব সামঞ্জস্য করার পদ্ধতি।
RL মাল্টি-অবজেক্টিভস কন্টিনিউ
একাধিক উদ্দেশ্য একসাথে অপ্টিমাইজেশন সহ ক্রিয়াগত স্থানের উপর প্রয়োগ।