মাল্টি-এজেন্ট ডিপ আরএল - কৃত্রিম বুদ্ধিমত্তা শব্দাবলী

📖

শব্দ

MARL (মাল্টি-এজেন্ট রিইনফোর্সমেন্ট লার্নিং)

শেখার একটি প্যারাডাইম যেখানে একাধিক এজেন্ট একটি শেয়ার্ড এনভায়রনমেন্টে একই সাথে ইন্টারঅ্যাক্ট করে, পৃথকভাবে বা সম্মিলিতভাবে সর্বোত্তম পলিসি শেখে।

📖

শব্দ

সেন্ট্রালাইজড ট্রেনিং উইথ ডিসেন্ট্রালাইজড এক্সিকিউশন (CTDE)

একটি পদ্ধতি যেখানে এজেন্টরা সেন্ট্রালাইজড গ্লোবাল ইনফরমেশন ব্যবহার করে ট্রেনিং করে কিন্তু তাদের পলিসিগুলো ডিসেন্ট্রালাইজডভাবে লোকাল অবজারভেশন দিয়ে এক্সিকিউট করে।

📖

শব্দ

QMIX (কিউ-ভ্যালু মিক্সিং)

কিউ-ভ্যালু ডিকম্পোজিশন অ্যালগরিদম যা জয়েন্ট কিউ-ভ্যালুকে এজেন্টদের পৃথক কিউ-ভ্যালুর মনোটোনিক নন-লিনিয়ার কম্বিনেশন হিসেবে রিপ্রেজেন্ট করে।

📖

শব্দ

VDN (ভ্যালু ডিকম্পোজিশন নেটওয়ার্কস)

টোটাল ভ্যালু ফ্যাক্টরাইজেশন পদ্ধতি যা কো-অপারেটিভ ফ্রেমওয়ার্কে জয়েন্ট ভ্যালুকে প্রতিটি এজেন্টের পৃথক ভ্যালুর যোগফলে ডিকম্পোজ করে।

📖

শব্দ

MADDPG (মাল্টি-এজেন্ট ডিপ ডিটারমিনিস্টিক পলিসি গ্রেডিয়েন্ট)

DDPG-এর মাল্টি-এজেন্ট এনভায়রনমেন্টে এক্সটেনশন যা মিক্সড এনভায়রনমেন্টের জন্য ডিসেন্ট্রালাইজড এক্সিকিউশন সহ সেন্ট্রালাইজড লার্নিং ব্যবহার করে।

📖

শব্দ

COMA (কাউন্টারফ্যাকচুয়াল মাল্টি-এজেন্ট পলিসি গ্রেডিয়েন্টস)

একটি অ্যালগরিদম যা কাউন্টারফ্যাকচুয়াল বেসিস ব্যবহার করে অনুমান করে যে কিভাবে পৃথক অ্যাকশনগুলো গ্লোবাল রিওয়ার্ডকে প্রভাবিত করে একটি এজেন্টের পলিসি পরিবর্তন করে যখন অন্যরা ফিক্সড থাকে।

📖

শব্দ

Dec-POMDP (ডিসেন্ট্রালাইজড পার্শিয়ালি অবজারভেবল মার্কভ ডিসিশন প্রসেস)

পার্শিয়াল অবজারভেশন এবং ডিসেন্ট্রালাইজড ডিসিশন মেকিং সহ মাল্টি-এজেন্ট সিকোয়েনশিয়াল ডিসিশন প্রবলেমের গাণিতিক ফরমালাইজেশন।

📖

শব্দ

ক্রেডিট অ্যাসাইনমেন্ট

মৌলিক সমস্যা যা কো-অপারেটিভ মাল্টি-এজেন্ট এনভায়রনমেন্টে প্রতিটি এজেন্টের সম্মিলিত রিওয়ার্ডে কন্ট্রিবিউশন নির্ধারণ করে।

📖

শব্দ

Joint Action Learning

Technique où les agents apprennent à coordonner leurs actions en considérant les actions simultanées de tous les agents dans l'environnement.

📖

শব্দ

Agent Modeling

Capacité d'un agent à construire et maintenir des modèles mentaux des intentions, croyances et politiques des autres agents dans l'environnement.

📖

শব্দ

Mean Field Theory in MARL

Approche théorique traitant les interactions multi-agents en grande échelle en approximant l'influence collective par un champ moyen statistique.

📖

শব্দ

Opponent Modeling

Processus d'apprentissage des stratégies et comportements des agents adverses pour anticiper leurs actions et optimiser sa propre politique dans des jeux compétitifs.

📖

শব্দ

Communication Protocols in MARL

Mécanismes permettant aux agents d'échanger des informations pour améliorer la coordination et l'efficacité collective dans des tâches coopératives.

📖

শব্দ

Cooperative MARL

Sous-domaine du MARL où les agents partagent un objectif commun et maximisent une récompense collective à travers la coordination et la collaboration.

📖

শব্দ

Competitive MARL

Cadre multi-agents où les individus ou équipes s'affrontent dans des jeux à somme nulle ou non-nulle pour maximiser leurs récompenses individuelles.

📖

শব্দ

Mixed-Motive MARL

Environnements multi-agents combinant éléments coopératifs et compétitifs, où les agents doivent équilibrer intérêts personnels et objectifs collectifs.

📖

শব্দ

উদীয়মান আচরণ

একটি ভাগ করা পরিবেশে শেখার এজেন্টদের মধ্যে মিথস্ক্রিয়া থেকে স্বতঃস্ফূর্তভাবে উদ্ভূত অ-প্রোগ্রামকৃত জটিল আচরণ।

📖

শব্দ

এমএআরএলে মনোযোগ প্রক্রিয়া

ভালো সিদ্ধান্ত নেওয়ার জন্য অন্যান্য এজেন্ট বা পরিবেশের অংশ থেকে নির্বাচনীভাবে তথ্য ওজন করার কৌশল।

📖

শব্দ

এমএআরএলে পাঠ্যক্রম শেখা

মাল্টি-এজেন্ট পরিবেশে শক্তিশালী নীতি শেখার সুবিধার্থে সহজ থেকে জটিল কাজের দিকে অগ্রসর হওয়ার প্রশিক্ষণ কৌশল।

📖

শব্দ

এমএআরএলে স্কেলযোগ্যতা

এজেন্ট সংখ্যা বৃদ্ধির সাথে যৌথ কর্মস্থানের সূচকীয় বৃদ্ধির মুখে শেখার কার্যকারিতা বজায় রাখার অ্যালগরিদমিক চ্যালেঞ্জ।

এআই গ্লসারি

MARL (মাল্টি-এজেন্ট রিইনফোর্সমেন্ট লার্নিং)

সেন্ট্রালাইজড ট্রেনিং উইথ ডিসেন্ট্রালাইজড এক্সিকিউশন (CTDE)

QMIX (কিউ-ভ্যালু মিক্সিং)

VDN (ভ্যালু ডিকম্পোজিশন নেটওয়ার্কস)

MADDPG (মাল্টি-এজেন্ট ডিপ ডিটারমিনিস্টিক পলিসি গ্রেডিয়েন্ট)

COMA (কাউন্টারফ্যাকচুয়াল মাল্টি-এজেন্ট পলিসি গ্রেডিয়েন্টস)

Dec-POMDP (ডিসেন্ট্রালাইজড পার্শিয়ালি অবজারভেবল মার্কভ ডিসিশন প্রসেস)

ক্রেডিট অ্যাসাইনমেন্ট

Joint Action Learning

Agent Modeling

Mean Field Theory in MARL

Opponent Modeling

Communication Protocols in MARL

Cooperative MARL

Competitive MARL

Mixed-Motive MARL

উদীয়মান আচরণ

এমএআরএলে মনোযোগ প্রক্রিয়া

এমএআরএলে পাঠ্যক্রম শেখা

এমএআরএলে স্কেলযোগ্যতা

কোন ফলাফল পাওয়া যায়নি