MARL আংশিকভাবে পর্যবেক্ষণযোগ্য - কৃত্রিম বুদ্ধিমত্তা শব্দাবলী

📖

শব্দ

POMDP (আংশিক পর্যবেক্ষণযোগ্য মার্কভ সিদ্ধান্ত প্রক্রিয়া)

একটি তাত্ত্বিক কাঠামো যা এমন পরিবেশ মডেল করে যেখানে এজেন্ট প্রকৃত অবস্থার শুধুমাত্র আংশিক পর্যবেক্ষণ পায়, সর্বোত্তম সিদ্ধান্ত নেওয়ার জন্য লুকানো অবস্থার উপর সম্ভাব্য অনুমান প্রয়োজন।

📖

শব্দ

পর্যবেক্ষণ স্থান

প্রতিটি এজেন্ট পরিবেশ থেকে যে আংশিক সংবেদনশীল সংকেতগুলি অনুভব করতে পারে তার সমষ্টি, যা সিস্টেমের সামগ্রিক অবস্থার অসম্পূর্ণ তথ্য উপস্থাপন করে।

📖

শব্দ

বিশ্বাস অবস্থা

লুকানো অবস্থার স্থানের উপর সম্ভাব্যতা বন্টন যা একটি এজেন্ট বজায় রাখে এবং তার ধারাবাহিক পর্যবেক্ষণ থেকে আপডেট করে, পরিবেশের প্রকৃত অবস্থা সম্পর্কে তার অনিশ্চয়তা উপস্থাপনের জন্য।

📖

শব্দ

যোগাযোগ প্রোটোকল

একটি প্রক্রিয়া যা সংজ্ঞায়িত করে কখন, কীভাবে এবং কোন তথ্য এজেন্টরা আংশিক পর্যবেক্ষণযোগ্য পরিবেশে তাদের কর্ম সমন্বয় করার জন্য একে অপরের সাথে বিনিময় করতে পারে।

📖

শব্দ

কেন্দ্রীয় প্রশিক্ষণ সাথে বিকেন্দ্রীভূত নির্বাহ

একটি পদ্ধতি যেখানে এজেন্টরা বিশ্বব্যাপী তথ্য (সবাইর অবস্থা, কর্ম) ব্যবহার করে প্রশিক্ষণ নেয় কিন্তু শুধুমাত্র তাদের স্থানীয় পর্যবেক্ষণ ব্যবহার করে স্বতন্ত্রভাবে তাদের নীতি নির্বাহ করে।

📖

শব্দ

মান ফাংশনের ফ্যাক্টরাইজেশন

একটি কৌশল যা সামগ্রিক মান ফাংশনকে স্বতন্ত্র বা স্থানীয় মান ফাংশনের যোগফলে বিভক্ত করে, বিশ্বব্যাপী সামঞ্জস্য বজায় রাখার সময় বিকেন্দ্রীভূত শেখার অনুমতি দেয়।

📖

শব্দ

প্রতিদ্বন্দ্বী মডেলিং

অন্যান্য এজেন্টদের পর্যবেক্ষিত আচরণের ভিত্তিতে তাদের নীতি বা উদ্দেশ্য অনুমানের প্রক্রিয়া, প্রতিযোগিতামূলক বা সহযোগী পরিবেশে সিদ্ধান্ত গ্রহণের জন্য অত্যন্ত গুরুত্বপূর্ণ।

📖

শব্দ

ক্রেডিট বরাদ্দ সমস্যা

একটি মাল্টি-এজেন্ট সিস্টেমে সামগ্রিক পুরস্কার সঠিকভাবে প্রতিটি এজেন্টকে বরাদ্দ করার অসুবিধা, বিশেষ করে জটিল যখন পর্যবেক্ষণ আংশিক এবং কর্মগুলি পরস্পর নির্ভরশীল।

📖

শব্দ

যৌথ কর্ম শেখা

এমন একটি পদ্ধতি যেখানে এজেন্টরা তাদের সম্মিলিত কর্মের সামগ্রিক পুরস্কারের উপর স্পষ্ট প্রভাব মডেল করে তাদের কর্মের সমন্বয় শেখে, যদিও আংশিক পর্যবেক্ষণযোগ্যতা থাকে।

📖

শব্দ

অবস্থা অনুমান

একটি অ্যালগরিদমিক প্রক্রিয়া যা একটি এজেন্টকে তার স্থানীয় পর্যবেক্ষণ এবং পরিবেশের মডেল থেকে সর্বাধিক সম্ভাব্য গ্লোবাল অবস্থা অনুমান করতে দেয়।

📖

শব্দ

তথ্য ভাগাভাগি

একটি কৌশল যা সংজ্ঞায়িত করে কিভাবে এজেন্টরা তাদের স্থানীয় পর্যবেক্ষণ বিতরণ এবং সমষ্টি করে পরিবেশের অবস্থার সম্মিলিত জ্ঞান উন্নত করে।

📖

শব্দ

স্থানীয় পর্যবেক্ষণের ইতিহাস

একটি এজেন্টের অতীতের পর্যবেক্ষণের সময়ক্রম, যা বর্তমান গ্লোবাল অবস্থা সম্পর্কে তথ্যের অভাব পূরণের জন্য অতিরিক্ত প্রসঙ্গ হিসাবে ব্যবহৃত হয়।

📖

শব্দ

মাল্টি-এজেন্ট আংশিক পর্যবেক্ষণযোগ্যতা

এমন একটি অবস্থা যেখানে কোনও পৃথক এজেন্ট সিস্টেমের সম্পূর্ণ অবস্থা পর্যবেক্ষণ করতে পারে না, সর্বোত্তম কর্মক্ষমতা অর্জনের জন্য সমন্বয় এবং অনুমান কৌশলের প্রয়োজন হয়।

📖

শব্দ

বিকেন্দ্রীকৃত নীতি

প্রতিটি এজেন্টের জন্য সিদ্ধান্ত গ্রহণের ফাংশন যা তার স্থানীয় পর্যবেক্ষণের ইতিহাসকে একটি কর্মে ম্যাপ করে, কার্যকর করার সময় অন্যান্য এজেন্টের তথ্যের উপর সরাসরি নির্ভরতা ছাড়াই।

📖

শব্দ

সাধারণ জ্ঞান

সেই তথ্য যা সমস্ত এজেন্ট জানে এবং জানে যে অন্যরাও জানে, আংশিক পর্যবেক্ষণযোগ্য পরিবেশে সমন্বয়ের জন্য অপরিহার্য।

📖

শব্দ

সমন্বয় গ্রাফ

এজেন্টদের মধ্যে মিথস্ক্রিয়া নির্ভরতা উপস্থাপনকারী কাঠামো, যা গ্লোবাল সিদ্ধান্ত গ্রহণের সমস্যাকে সমাধান করা সহজ স্থানীয় উপ-সমস্যায় ফ্যাক্টরাইজ করতে দেয়।

এআই গ্লসারি

POMDP (আংশিক পর্যবেক্ষণযোগ্য মার্কভ সিদ্ধান্ত প্রক্রিয়া)

পর্যবেক্ষণ স্থান

বিশ্বাস অবস্থা

যোগাযোগ প্রোটোকল

কেন্দ্রীয় প্রশিক্ষণ সাথে বিকেন্দ্রীভূত নির্বাহ

মান ফাংশনের ফ্যাক্টরাইজেশন

প্রতিদ্বন্দ্বী মডেলিং

ক্রেডিট বরাদ্দ সমস্যা

যৌথ কর্ম শেখা

অবস্থা অনুমান

তথ্য ভাগাভাগি

স্থানীয় পর্যবেক্ষণের ইতিহাস

মাল্টি-এজেন্ট আংশিক পর্যবেক্ষণযোগ্যতা

বিকেন্দ্রীকৃত নীতি

সাধারণ জ্ঞান

সমন্বয় গ্রাফ

কোন ফলাফল পাওয়া যায়নি