এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
MARL (মাল্টি-এজেন্ট রিইনফোর্সমেন্ট লার্নিং)
শেখার একটি প্যারাডাইম যেখানে একাধিক এজেন্ট একটি শেয়ার্ড এনভায়রনমেন্টে একই সাথে ইন্টারঅ্যাক্ট করে, পৃথকভাবে বা সম্মিলিতভাবে সর্বোত্তম পলিসি শেখে।
সেন্ট্রালাইজড ট্রেনিং উইথ ডিসেন্ট্রালাইজড এক্সিকিউশন (CTDE)
একটি পদ্ধতি যেখানে এজেন্টরা সেন্ট্রালাইজড গ্লোবাল ইনফরমেশন ব্যবহার করে ট্রেনিং করে কিন্তু তাদের পলিসিগুলো ডিসেন্ট্রালাইজডভাবে লোকাল অবজারভেশন দিয়ে এক্সিকিউট করে।
QMIX (কিউ-ভ্যালু মিক্সিং)
কিউ-ভ্যালু ডিকম্পোজিশন অ্যালগরিদম যা জয়েন্ট কিউ-ভ্যালুকে এজেন্টদের পৃথক কিউ-ভ্যালুর মনোটোনিক নন-লিনিয়ার কম্বিনেশন হিসেবে রিপ্রেজেন্ট করে।
VDN (ভ্যালু ডিকম্পোজিশন নেটওয়ার্কস)
টোটাল ভ্যালু ফ্যাক্টরাইজেশন পদ্ধতি যা কো-অপারেটিভ ফ্রেমওয়ার্কে জয়েন্ট ভ্যালুকে প্রতিটি এজেন্টের পৃথক ভ্যালুর যোগফলে ডিকম্পোজ করে।
MADDPG (মাল্টি-এজেন্ট ডিপ ডিটারমিনিস্টিক পলিসি গ্রেডিয়েন্ট)
DDPG-এর মাল্টি-এজেন্ট এনভায়রনমেন্টে এক্সটেনশন যা মিক্সড এনভায়রনমেন্টের জন্য ডিসেন্ট্রালাইজড এক্সিকিউশন সহ সেন্ট্রালাইজড লার্নিং ব্যবহার করে।
COMA (কাউন্টারফ্যাকচুয়াল মাল্টি-এজেন্ট পলিসি গ্রেডিয়েন্টস)
একটি অ্যালগরিদম যা কাউন্টারফ্যাকচুয়াল বেসিস ব্যবহার করে অনুমান করে যে কিভাবে পৃথক অ্যাকশনগুলো গ্লোবাল রিওয়ার্ডকে প্রভাবিত করে একটি এজেন্টের পলিসি পরিবর্তন করে যখন অন্যরা ফিক্সড থাকে।
Dec-POMDP (ডিসেন্ট্রালাইজড পার্শিয়ালি অবজারভেবল মার্কভ ডিসিশন প্রসেস)
পার্শিয়াল অবজারভেশন এবং ডিসেন্ট্রালাইজড ডিসিশন মেকিং সহ মাল্টি-এজেন্ট সিকোয়েনশিয়াল ডিসিশন প্রবলেমের গাণিতিক ফরমালাইজেশন।
ক্রেডিট অ্যাসাইনমেন্ট
মৌলিক সমস্যা যা কো-অপারেটিভ মাল্টি-এজেন্ট এনভায়রনমেন্টে প্রতিটি এজেন্টের সম্মিলিত রিওয়ার্ডে কন্ট্রিবিউশন নির্ধারণ করে।
Joint Action Learning
Technique où les agents apprennent à coordonner leurs actions en considérant les actions simultanées de tous les agents dans l'environnement.
Agent Modeling
Capacité d'un agent à construire et maintenir des modèles mentaux des intentions, croyances et politiques des autres agents dans l'environnement.
Mean Field Theory in MARL
Approche théorique traitant les interactions multi-agents en grande échelle en approximant l'influence collective par un champ moyen statistique.
Opponent Modeling
Processus d'apprentissage des stratégies et comportements des agents adverses pour anticiper leurs actions et optimiser sa propre politique dans des jeux compétitifs.
Communication Protocols in MARL
Mécanismes permettant aux agents d'échanger des informations pour améliorer la coordination et l'efficacité collective dans des tâches coopératives.
Cooperative MARL
Sous-domaine du MARL où les agents partagent un objectif commun et maximisent une récompense collective à travers la coordination et la collaboration.
Competitive MARL
Cadre multi-agents où les individus ou équipes s'affrontent dans des jeux à somme nulle ou non-nulle pour maximiser leurs récompenses individuelles.
Mixed-Motive MARL
Environnements multi-agents combinant éléments coopératifs et compétitifs, où les agents doivent équilibrer intérêts personnels et objectifs collectifs.
উদীয়মান আচরণ
একটি ভাগ করা পরিবেশে শেখার এজেন্টদের মধ্যে মিথস্ক্রিয়া থেকে স্বতঃস্ফূর্তভাবে উদ্ভূত অ-প্রোগ্রামকৃত জটিল আচরণ।
এমএআরএলে মনোযোগ প্রক্রিয়া
ভালো সিদ্ধান্ত নেওয়ার জন্য অন্যান্য এজেন্ট বা পরিবেশের অংশ থেকে নির্বাচনীভাবে তথ্য ওজন করার কৌশল।
এমএআরএলে পাঠ্যক্রম শেখা
মাল্টি-এজেন্ট পরিবেশে শক্তিশালী নীতি শেখার সুবিধার্থে সহজ থেকে জটিল কাজের দিকে অগ্রসর হওয়ার প্রশিক্ষণ কৌশল।
এমএআরএলে স্কেলযোগ্যতা
এজেন্ট সংখ্যা বৃদ্ধির সাথে যৌথ কর্মস্থানের সূচকীয় বৃদ্ধির মুখে শেখার কার্যকারিতা বজায় রাখার অ্যালগরিদমিক চ্যালেঞ্জ।