🏠 Trang chủ
Benchmark
📊 Tất cả benchmark 🦖 Khủng long v1 🦖 Khủng long v2 ✅ Ứng dụng To-Do List 🎨 Trang tự do sáng tạo 🎯 FSACB - Trình diễn cuối cùng 🌍 Benchmark dịch thuật
Mô hình
🏆 Top 10 mô hình 🆓 Mô hình miễn phí 📋 Tất cả mô hình ⚙️ Kilo Code
Tài nguyên
💬 Thư viện prompt 📖 Thuật ngữ AI 🔗 Liên kết hữu ích

Thuật ngữ AI

Từ điển đầy đủ về Trí tuệ nhân tạo

162
danh mục
2.032
danh mục con
23.060
thuật ngữ
📖
thuật ngữ

Apprentissage par Renforcement Multi-Agents (MARL)

Paradigme d'apprentissage où plusieurs agents interagissent et apprennent simultanément dans un environnement partagé, souvent de manière concurrente ou coopérative pour maximiser une récompense collective ou individuelle.

📖
thuật ngữ

Jeux à Somme Non Nulle

Contexte d'interaction où les gains totaux des agents ne sont pas fixes, permettant des situations de coopération où les agents peuvent mutuellement bénéficier de leurs actions pour améliorer la récompense globale.

📖
thuật ngữ

Q-Learning Décentralisé

Variante du Q-Learning où chaque agent apprend sa propre fonction de valeur Q de manière indépendante, sans partage direct d'informations sur les politiques ou les valeurs des autres agents.

📖
thuật ngữ

Q-Learning Centralisé avec Exécution Décentralisée (CTDE)

Cadre d'apprentissage où les agents utilisent des informations globales (centralisées) durant la phase d'entraînement pour évaluer les actions, mais prennent leurs décisions de manière décentralisée lors de l'exécution.

📖
thuật ngữ

Théorie des Jeux Stochastiques

Extension de la théorie des jeux aux environnements où les transitions d'états et les récompenses sont probabilistes, fournissant un modèle mathématique formel pour les interactions multi-agents dans des contextes dynamiques.

📖
thuật ngữ

Dilemme du Prisonnier Itératif

Version répétée du dilemme du prisonnier, utilisée en MARL pour étudier l'émergence de stratégies coopératives ou compétitives basées sur l'historique des interactions entre agents.

📖
thuật ngữ

Réseaux d'Agents Adversariaux (GANs Multi-Agents)

Application des réseaux génératifs adversariaux où plusieurs agents (générateurs et discriminateurs) sont en compétition, chacun apprenant à améliorer sa performance en réponse aux stratégies des autres.

📖
thuật ngữ

Apprentissage par Renforcement Hiérarchique Multi-Agents

Approche structurant l'apprentissage sur plusieurs niveaux, où des agents de haut niveau définissent des sous-tâches pour des agents de bas niveau, facilitant la résolution de problèmes complexes et la coordination.

📖
thuật ngữ

Stabilité Environnementale

Problème en MARL où l'environnement perçu par un agent change constamment car les autres agents apprennent et adaptent leurs politiques, rendant l'apprentissage d'une politique optimale particulièrement difficile.

📖
thuật ngữ

Exploration vs Exploitation en Multi-Agents

Dilemme complexifié par la présence d'autres agents, où l'exploration d'un agent peut être perçue comme du bruit ou une action hostile par les autres, et où l'exploitation peut dépendre des stratégies concurrentes.

📖
thuật ngữ

Apprentissage par Renforcement Inverse Multi-Agents

Technique où les agents infèrent la fonction de récompense ou les intentions des autres agents en observant leur comportement, afin de mieux prédire leurs actions et de coopérer ou de compétitionner plus efficacement.

📖
thuật ngữ

Politiques Mixtes

Stratégie où un agent choisit ses actions selon une distribution de probabilité, plutôt que de manière déterministe, essentielle pour atteindre un équilibre de Nash dans les jeux à somme nulle.

📖
thuật ngữ

Formation de Coalitions

Processus dynamique par lequel des sous-groupes d'agents s'allient pour poursuivre un objectif commun, partageant des récompenses et des informations pour améliorer leur performance par rapport à une action individuelle.

📖
thuật ngữ

Apprentissage Continu Multi-Agents

Défi consistant à permettre aux agents d'adapter leurs politiques à de nouvelles tâches ou à l'arrivée/départ d'autres agents sans oublier les connaissances précédemment acquises, assurant la robustesse et la flexibilité du système.

📖
thuật ngữ

Méta-Apprentissage en MARL

Approche visant à entraîner des agents à apprendre comment apprendre efficacement dans une variété de tâches multi-agents, leur permettant de s'adapter rapidement à de nouveaux environnements ou à de nouvelles configurations d'agents.

🔍

Không tìm thấy kết quả