এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
স্বায়ত্তশাসিত এজেন্ট
সফটওয়্যার সত্তা যা তাদের পরিবেশের উপলব্ধি এবং নিজস্ব লক্ষ্যের ভিত্তিতে সরাসরি মানব হস্তক্ষেপ ছাড়াই স্বাধীন সিদ্ধান্ত নিতে সক্ষম।
এজেন্টদের মধ্যে সহযোগিতা
একটি কৌশল যেখানে একাধিক এজেন্ট একটি সাধারণ লক্ষ্য অর্জনের জন্য সহযোগিতা করে, তথ্য ভাগ করে এবং সম্মিলিত পুরস্কার সর্বাধিক করার জন্য তাদের কর্ম সমন্বয় করে।
এজেন্টদের মধ্যে প্রতিযোগিতা
এমন পরিস্থিতি যেখানে এজেন্টরা পরস্পরবিরোধী লক্ষ্য অনুসরণ করে, প্রত্যেকে পরিবেশের অন্যান্য এজেন্টের ক্ষতি করে নিজস্ব পুরস্কার সর্বাধিক করার চেষ্টা করে।
বিকেন্দ্রীকৃত শিক্ষণ
একটি পদ্ধতি যেখানে প্রতিটি এজেন্ট বৈশ্বিক অবস্থা বা অন্যান্য এজেন্টের কর্মে প্রবেশাধিকার ছাড়াই স্বাধীনভাবে নিজস্ব নীতি শেখে, শুধুমাত্র নিজস্ব স্থানীয় পর্যবেক্ষণ ব্যবহার করে।
কেন্দ্রীকৃত শিক্ষণ
একটি পদ্ধতি যেখানে একটি কেন্দ্রীয় নিয়ন্ত্রকের পরিবেশের সমস্ত তথ্যে প্রবেশাধিকার থাকে এবং একটি সামগ্রিক লক্ষ্য অপ্টিমাইজ করার জন্য সমস্ত এজেন্টের কর্ম সমন্বয় করে।
আন্তঃ-এজেন্ট যোগাযোগ
একটি প্রক্রিয়া যা এজেন্টদের জটিল কাজে তাদের সমন্বয় এবং সম্মিলিত কর্মক্ষমতা উন্নত করার জন্য সরাসরি তথ্য বিনিময় করতে দেয়।
শূন্য-সমষ্টি খেলা
একটি প্রতিযোগিতামূলক দৃশ্যকল্প যেখানে মোট লাভ ধ্রুবক, বোঝায় যে একটি এজেন্টের লাভ সিস্টেমের অন্যান্য এজেন্টের ক্ষতির সাথে ঠিক মিলে যায়।
অ-শূন্য-সমষ্টি খেলা
এমন পরিস্থিতি যেখানে এজেন্টরা মোট লাভ বাড়ানোর জন্য সহযোগিতা করতে পারে, পারস্পরিকভাবে উপকারী ফলাফল এবং সহযোগিতামূলক কৌশলগুলির অনুমতি দেয়।
গেম থিওরি
পরস্পরনির্ভর সিদ্ধান্ত গ্রহণকারী যুক্তিসম্মত এজেন্টদের মধ্যে কৌশলগত মিথস্ক্রিয়া মডেল এবং বিশ্লেষণের জন্য গাণিতিক কাঠামো।
শেয়ার্ড পলিসি
একটি পদ্ধতি যেখানে একাধিক এজেন্ট একটি সাধারণ নীতি বা নিউরাল নেটওয়ার্ক প্যারামিটার ভাগ করে, যা আরও কার্যকর শেখার এবং বর্ধিত সাধারণীকরণের অনুমতি দেয়।
মাল্টি-এজেন্ট রিওয়ার্ড শেপিং
পলিসির সর্বোত্তমতা বজায় রাখার সময় এজেন্টদের শেখাকে কাঙ্ক্ষিত আচরণের দিকে নির্দেশিত করার জন্য পুরস্কার ফাংশন পরিবর্তনের কৌশল।
মাল্টি-এজেন্ট এক্সপ্লোরেশন বনাম এক্সপ্লয়টেশন
মাল্টি-এজেন্ট প্রেক্ষাপটে জটিল দ্বিধা যেখানে প্রতিটি এজেন্টকে অন্যদের প্রভাব বিবেচনা করে নতুন কৌশল আবিষ্কার এবং অর্জিত জ্ঞান ব্যবহারের মধ্যে ভারসাম্য বজায় রাখতে হয়।
সমষ্টিগত আচরণের উদ্ভব
একটি ঘটনা যেখানে জটিল এবং সংগঠিত আচরণ স্থানীয় নিয়ম অনুসরণকারী সাধারণ এজেন্টদের মিথস্ক্রিয়া থেকে স্বতঃস্ফূর্তভাবে উদ্ভূত হয়, কোনো স্পষ্ট কেন্দ্রীয় নিয়ন্ত্রণ ছাড়াই।
বিতরণিত মাল্টি-এজেন্ট সিস্টেম
একটি স্থাপত্য যেখানে এজেন্টরা বিভিন্ন গণনামূলক নোডে বিতরণিত হয়, বৃহৎ আকারের সহযোগিতামূলক কাজ সম্পাদনের জন্য নেটওয়ার্ক প্রোটোকলের মাধ্যমে যোগাযোগ করে।
হায়ারার্কিক্যাল রিইনফোর্সমেন্ট লার্নিং
শেখাকে স্তরবদ্ধ স্তরে কাঠামোগতকরণের একটি পদ্ধতি, যেখানে মেটা-এজেন্টরা জটিল সমস্যাগুলি পচনের মাধ্যমে সমাধান করার জন্য সাব-এজেন্ট নিয়ন্ত্রণ করে।
মার্কভ গেমস
স্টোকাস্টিক গেমের গাণিতিক ফর্মালাইজেশন যেখানে এজেন্টরা প্রতিটি ধাপে একই সাথে সিদ্ধান্ত নেয়, মার্কভিয়ান অবস্থা রূপান্তর এবং স্বতন্ত্র পুরস্কার সহ।