মাল্টি-এজেন্ট লার্নিং - কৃত্রিম বুদ্ধিমত্তা শব্দাবলী

📖

শব্দ

স্বায়ত্তশাসিত এজেন্ট

সফটওয়্যার সত্তা যা তাদের পরিবেশের উপলব্ধি এবং নিজস্ব লক্ষ্যের ভিত্তিতে সরাসরি মানব হস্তক্ষেপ ছাড়াই স্বাধীন সিদ্ধান্ত নিতে সক্ষম।

📖

শব্দ

এজেন্টদের মধ্যে সহযোগিতা

একটি কৌশল যেখানে একাধিক এজেন্ট একটি সাধারণ লক্ষ্য অর্জনের জন্য সহযোগিতা করে, তথ্য ভাগ করে এবং সম্মিলিত পুরস্কার সর্বাধিক করার জন্য তাদের কর্ম সমন্বয় করে।

📖

শব্দ

এজেন্টদের মধ্যে প্রতিযোগিতা

এমন পরিস্থিতি যেখানে এজেন্টরা পরস্পরবিরোধী লক্ষ্য অনুসরণ করে, প্রত্যেকে পরিবেশের অন্যান্য এজেন্টের ক্ষতি করে নিজস্ব পুরস্কার সর্বাধিক করার চেষ্টা করে।

📖

শব্দ

বিকেন্দ্রীকৃত শিক্ষণ

একটি পদ্ধতি যেখানে প্রতিটি এজেন্ট বৈশ্বিক অবস্থা বা অন্যান্য এজেন্টের কর্মে প্রবেশাধিকার ছাড়াই স্বাধীনভাবে নিজস্ব নীতি শেখে, শুধুমাত্র নিজস্ব স্থানীয় পর্যবেক্ষণ ব্যবহার করে।

📖

শব্দ

কেন্দ্রীকৃত শিক্ষণ

একটি পদ্ধতি যেখানে একটি কেন্দ্রীয় নিয়ন্ত্রকের পরিবেশের সমস্ত তথ্যে প্রবেশাধিকার থাকে এবং একটি সামগ্রিক লক্ষ্য অপ্টিমাইজ করার জন্য সমস্ত এজেন্টের কর্ম সমন্বয় করে।

📖

শব্দ

আন্তঃ-এজেন্ট যোগাযোগ

একটি প্রক্রিয়া যা এজেন্টদের জটিল কাজে তাদের সমন্বয় এবং সম্মিলিত কর্মক্ষমতা উন্নত করার জন্য সরাসরি তথ্য বিনিময় করতে দেয়।

📖

শব্দ

শূন্য-সমষ্টি খেলা

একটি প্রতিযোগিতামূলক দৃশ্যকল্প যেখানে মোট লাভ ধ্রুবক, বোঝায় যে একটি এজেন্টের লাভ সিস্টেমের অন্যান্য এজেন্টের ক্ষতির সাথে ঠিক মিলে যায়।

📖

শব্দ

অ-শূন্য-সমষ্টি খেলা

এমন পরিস্থিতি যেখানে এজেন্টরা মোট লাভ বাড়ানোর জন্য সহযোগিতা করতে পারে, পারস্পরিকভাবে উপকারী ফলাফল এবং সহযোগিতামূলক কৌশলগুলির অনুমতি দেয়।

📖

শব্দ

গেম থিওরি

পরস্পরনির্ভর সিদ্ধান্ত গ্রহণকারী যুক্তিসম্মত এজেন্টদের মধ্যে কৌশলগত মিথস্ক্রিয়া মডেল এবং বিশ্লেষণের জন্য গাণিতিক কাঠামো।

📖

শব্দ

শেয়ার্ড পলিসি

একটি পদ্ধতি যেখানে একাধিক এজেন্ট একটি সাধারণ নীতি বা নিউরাল নেটওয়ার্ক প্যারামিটার ভাগ করে, যা আরও কার্যকর শেখার এবং বর্ধিত সাধারণীকরণের অনুমতি দেয়।

📖

শব্দ

মাল্টি-এজেন্ট রিওয়ার্ড শেপিং

পলিসির সর্বোত্তমতা বজায় রাখার সময় এজেন্টদের শেখাকে কাঙ্ক্ষিত আচরণের দিকে নির্দেশিত করার জন্য পুরস্কার ফাংশন পরিবর্তনের কৌশল।

📖

শব্দ

মাল্টি-এজেন্ট এক্সপ্লোরেশন বনাম এক্সপ্লয়টেশন

মাল্টি-এজেন্ট প্রেক্ষাপটে জটিল দ্বিধা যেখানে প্রতিটি এজেন্টকে অন্যদের প্রভাব বিবেচনা করে নতুন কৌশল আবিষ্কার এবং অর্জিত জ্ঞান ব্যবহারের মধ্যে ভারসাম্য বজায় রাখতে হয়।

📖

শব্দ

সমষ্টিগত আচরণের উদ্ভব

একটি ঘটনা যেখানে জটিল এবং সংগঠিত আচরণ স্থানীয় নিয়ম অনুসরণকারী সাধারণ এজেন্টদের মিথস্ক্রিয়া থেকে স্বতঃস্ফূর্তভাবে উদ্ভূত হয়, কোনো স্পষ্ট কেন্দ্রীয় নিয়ন্ত্রণ ছাড়াই।

📖

শব্দ

বিতরণিত মাল্টি-এজেন্ট সিস্টেম

একটি স্থাপত্য যেখানে এজেন্টরা বিভিন্ন গণনামূলক নোডে বিতরণিত হয়, বৃহৎ আকারের সহযোগিতামূলক কাজ সম্পাদনের জন্য নেটওয়ার্ক প্রোটোকলের মাধ্যমে যোগাযোগ করে।

📖

শব্দ

হায়ারার্কিক্যাল রিইনফোর্সমেন্ট লার্নিং

শেখাকে স্তরবদ্ধ স্তরে কাঠামোগতকরণের একটি পদ্ধতি, যেখানে মেটা-এজেন্টরা জটিল সমস্যাগুলি পচনের মাধ্যমে সমাধান করার জন্য সাব-এজেন্ট নিয়ন্ত্রণ করে।

📖

শব্দ

মার্কভ গেমস

স্টোকাস্টিক গেমের গাণিতিক ফর্মালাইজেশন যেখানে এজেন্টরা প্রতিটি ধাপে একই সাথে সিদ্ধান্ত নেয়, মার্কভিয়ান অবস্থা রূপান্তর এবং স্বতন্ত্র পুরস্কার সহ।

এআই গ্লসারি

স্বায়ত্তশাসিত এজেন্ট

এজেন্টদের মধ্যে সহযোগিতা

এজেন্টদের মধ্যে প্রতিযোগিতা

বিকেন্দ্রীকৃত শিক্ষণ

কেন্দ্রীকৃত শিক্ষণ

আন্তঃ-এজেন্ট যোগাযোগ

শূন্য-সমষ্টি খেলা

অ-শূন্য-সমষ্টি খেলা

গেম থিওরি

শেয়ার্ড পলিসি

মাল্টি-এজেন্ট রিওয়ার্ড শেপিং

মাল্টি-এজেন্ট এক্সপ্লোরেশন বনাম এক্সপ্লয়টেশন

সমষ্টিগত আচরণের উদ্ভব

বিতরণিত মাল্টি-এজেন্ট সিস্টেম

হায়ারার্কিক্যাল রিইনফোর্সমেন্ট লার্নিং

মার্কভ গেমস

কোন ফলাফল পাওয়া যায়নি