মাল্টি-অবজেক্টিভ রিইনফোর্সমেন্ট লার্নিং - কৃত্রিম বুদ্ধিমত্তা শব্দাবলী

📂

উপ-বিভাগ

ওজনযুক্ত রৈখিক স্কেলারাইজেশন

একাধিক উদ্দেশ্য সমস্যাকে একটি একক উদ্দেশ্যে হ্রাস করার জন্য রৈখিক ওজন দ্বারা উদ্দেশ্যগুলি সমন্বয় করার পদ্ধতি।

17 শব্দ

📂

উপ-বিভাগ

Front de Pareto

Ensemble des solutions optimales non-dominées où aucun objectif ne peut être amélioré sans en dégrader un autre.

10 শব্দ

📂

উপ-বিভাগ

সীমাবদ্ধতা সহ শক্তিশালীকরণ শিক্ষা

অন্যান্য উদ্দেশ্যে সীমাবদ্ধতা মেনে চলার সময় একটি প্রধান উদ্দেশ্য অপ্টিমাইজ করার পদ্ধতি।

20 শব্দ

📂

উপ-বিভাগ

সমঝোতার পদ্ধতি

নির্দিষ্ট পছন্দ অনুযায়ী পরস্পরবিরোধী লক্ষ্যগুলোর মধ্যে স্পষ্টভাবে ভারসাম্য রক্ষাকারী কৌশল।

16 শব্দ

📂

উপ-বিভাগ

Q-Learning বহুবস্তু

Q-Learning অ্যালগরিদমের সম্প্রসারণ যা স্কেলার মানের পরিবর্তে পুরস্কার ভেক্টর পরিচালনা করে।

11 শব্দ

📂

উপ-বিভাগ

মাল্টি-অবজেক্টিভ ইভোলিউশনারি অপ্টিমাইজেশন

প্যারেটো ফ্রন্ট এক্সপ্লোর করার জন্য ইভোলিউশনারি অ্যালগরিদমের সাথে আরএল-এর সমন্বয়।

9 শব্দ

📂

উপ-বিভাগ

মাল্টি-অবজেক্টিভ হায়ারার্কিক্যাল রিইনফোর্সমেন্ট লার্নিং

হায়ারার্কিক্যাল স্ট্রাকচার যেখানে বিভিন্ন স্তর বিভিন্ন উদ্দেশ্য বা উদ্দেশ্যের সংমিশ্রণ পরিচালনা করে।

11 শব্দ

📂

উপ-বিভাগ

বহু-উদ্দেশ্য নীতি

বিভিন্ন উদ্দেশ্যের মধ্যে সমন্বয় অনুযায়ী সর্বোত্তম কর্ম উৎপাদনকারী সিদ্ধান্ত ব্যবস্থা।

11 শব্দ

📂

উপ-বিভাগ

মাল্টি-অবজেক্টিভ ভ্যালু ফাংশন

সমস্ত উদ্দেশ্য একসাথে বিবেচনা করে অবস্থা বা কর্মের ভেক্টর উপস্থাপনা।

18 শব্দ

📂

উপ-বিভাগ

ডিপ আরএল মাল্টি-অবজেক্টিভস

জটিল মাল্টি-অবজেক্টিভ সমাধান আনুমানিক করার জন্য গভীর নিউরাল নেটওয়ার্কের প্রয়োগ।

11 শব্দ

📂

উপ-বিভাগ

লক্ষ্যের স্থান অন্বেষণ

প্যারেটো ফ্রন্ট আবিষ্কারের জন্য নকশাকৃত অন্বেষণ কৌশল।

9 শব্দ

📂

উপ-বিভাগ

মাল্টি-এজেন্ট মাল্টি-অবজেক্টিভ রিইনফোর্সমেন্ট লার্নিং

মাল্টি-এজেন্টে সম্প্রসারণ যেখানে প্রতিটি এজেন্ট বা সমষ্টিগত সিস্টেম একাধিক উদ্দেশ্য অপ্টিমাইজ করে।

13 শব্দ

📂

উপ-বিভাগ

বহু-উদ্দেশ্য নীতিমালার মূল্যায়ন

বহু-উদ্দেশ্য সমাধানগুলি মূল্যায়ন ও তুলনা করার জন্য নির্দিষ্ট মেট্রিক্স এবং পদ্ধতি।

17 শব্দ

📂

উপ-বিভাগ

পন্ডারনের গতিশীল অভিযোজন

শিক্ষার সময় স্বয়ংক্রিয়ভাবে উদ্দেশ্যগুলির আপেক্ষিক গুরুত্ব সামঞ্জস্য করার পদ্ধতি।

18 শব্দ

📂

উপ-বিভাগ

RL মাল্টি-অবজেক্টিভস কন্টিনিউ

একাধিক উদ্দেশ্য একসাথে অপ্টিমাইজেশন সহ ক্রিয়াগত স্থানের উপর প্রয়োগ।

16 শব্দ

এআই গ্লসারি

ওজনযুক্ত রৈখিক স্কেলারাইজেশন

Front de Pareto

সীমাবদ্ধতা সহ শক্তিশালীকরণ শিক্ষা

সমঝোতার পদ্ধতি

Q-Learning বহুবস্তু

মাল্টি-অবজেক্টিভ ইভোলিউশনারি অপ্টিমাইজেশন

মাল্টি-অবজেক্টিভ হায়ারার্কিক্যাল রিইনফোর্সমেন্ট লার্নিং

বহু-উদ্দেশ্য নীতি

মাল্টি-অবজেক্টিভ ভ্যালু ফাংশন

ডিপ আরএল মাল্টি-অবজেক্টিভস

লক্ষ্যের স্থান অন্বেষণ

মাল্টি-এজেন্ট মাল্টি-অবজেক্টিভ রিইনফোর্সমেন্ট লার্নিং

বহু-উদ্দেশ্য নীতিমালার মূল্যায়ন

পন্ডারনের গতিশীল অভিযোজন

RL মাল্টি-অবজেক্টিভস কন্টিনিউ

কোন ফলাফল পাওয়া যায়নি