多智能体探索 - AI 詞彙表

📖

術語

多智能体随机探索

一种探索策略，每个智能体使用概率策略来发现环境，同时考虑其他智能体引入的不确定性。这种方法能够在动态系统中保持个体探索与集体协调之间的平衡。

📖

術語

多智能体探索-利用平衡

多智能体强化学习中的基本困境，智能体必须在发现新策略与利用已获知识之间做出决定，同时考虑智能体间的相互作用。随着系统中智能体数量的增加，复杂性呈指数级增长。

📖

術語

多智能体基于好奇心的探索

一种内在探索机制，每个智能体受到自身好奇心的驱动，同时与其他智能体的好奇心相互作用以发现复杂状态。这种方法将个体内在奖励与协作发现奖励相结合。

📖

術語

多智能体对抗性探索

一种探索策略，目标对立的智能体在环境发现过程中相互影响。这种配置创造了一种演化式探索动态，每个智能体必须适应其对手的探索策略。

📖

術語

去中心化协调探索

一种方法，智能体以自主方式探索环境，同时发展隐式协调机制以避免冗余并最大化覆盖范围。智能体通过局部通信来同步其探索策略，无需集中控制。

📖

術語

上下文自适应探索

一种探索方法，根据多智能体环境的全局和局部上下文动态调整智能体的策略。智能体基于智能体密度和探索区域的复杂性来调整其探索率。

📖

術語

社会学习探索

一种探索过程，智能体通过观察和模仿系统中其他智能体的行为来学习有效的探索策略。这种方法将个体探索与集体知识利用相结合。

📖

術語

隐式通信探索

一种策略，智能体通过其他智能体过去和现在的行动来推断其意图和探索计划。这种间接通信允许在没有明确信息交换的情况下实现有效协调。

📖

術語

多智能体模仿探索

一种探索技术，智能体通过模仿其他专家或示范智能体的成功探索轨迹来学习探索。这种方法在保持探索多样性的同时，加速了相关状态的发现。

📖

術語

图神经网络探索

使用图神经网络建模智能体间关系，基于交互网络拓扑指导协作探索的方法。智能体利用关系结构来优化其探索决策。

📖

術語

多智能体注意力探索

一种探索机制，每个智能体使用注意力机制专注于其他智能体的相关动作和状态。这种方法基于智能体间信息的相对重要性实现选择性探索。

📖

術語

分层策略探索

多层次探索结构，元策略根据系统全局目标指导智能体的基础探索策略。这种层次结构允许在不同时间和空间尺度上进行一致探索。

📖

術語

动作空间解耦探索

将状态空间探索与动作空间探索分离的技术，以管理多智能体环境中的指数级复杂性。智能体在组合之前独立探索状态和动作维度。

📖

術語

贝叶斯优化探索

使用高斯过程建模不确定性并引导智能体朝向状态-动作空间中有前景区域的探索方法。该方法基于概率推断优化探索效率。

📖

術語

多智能体上下文赌博机探索

一种探索框架，每个智能体将其他智能体视为多臂赌博机问题中的动态上下文。智能体通过学习动态适应上下文变化来进行探索。

📖

術語

元学习探索

智能体学习元探索策略的方法，这些策略能够快速适应新的多智能体配置。该技术将在一个环境中获得的探索知识迁移到其他类似情境中。

📖

術語

分布式模拟退火探索

分布式探索算法，每个智能体维护自己的退火温度，同时全局协调冷却过程。这种方法允许初始的全面探索，随后逐步收敛。

📖

術語

最大多样性探索

旨在最大化智能体集体探索轨迹多样性的策略，以有效覆盖状态-动作空间。智能体因发现相对于群体已探索状态的独特状态而获得奖励。

📖

術語

协同进化探索

智能体策略相互响应同时进化的探索过程，创造探索性的军备竞赛动态。这种方法产生复杂且自适应的探索行为。

📖

術語

动态向量量化探索

使用自适应向量量化来持续离散化智能体共享的状态-动作空间的探索方法。智能体探索低密度区域以改善空间覆盖。

AI 詞彙表