Aprendizaje por Refuerzo Multiagente

📖

términos

Aprendizaje por Refuerzo Multiagente (MARL)

Paradigma de aprendizaje en el que varios agentes interactúan y aprenden simultáneamente en un entorno compartido, a menudo de manera competitiva o cooperativa para maximizar una recompensa colectiva o individual.

📖

términos

Juegos de Suma No Cero

Contexto de interacción en el que las ganancias totales de los agentes no son fijas, permitiendo situaciones de cooperación donde los agentes pueden beneficiarse mutuamente de sus acciones para mejorar la recompensa global.

📖

términos

Q-Learning Descentralizado

Variante del Q-Learning en la que cada agente aprende su propia función de valor Q de manera independiente, sin compartir directamente información sobre las políticas o los valores de otros agentes.

📖

términos

Q-Learning Centralizado con Ejecución Descentralizada (CTDE)

Marco de aprendizaje en el que los agentes utilizan información global (centralizada) durante la fase de entrenamiento para evaluar las acciones, pero toman sus decisiones de manera descentralizada durante la ejecución.

📖

términos

Teoría de Juegos Estocásticos

Extensión de la teoría de juegos a entornos donde las transiciones de estados y las recompensas son probabilísticas, proporcionando un modelo matemático formal para las interacciones multiagente en contextos dinámicos.

📖

términos

Dilema del Prisionero Iterativo

Versión repetida del dilema del prisionero, utilizada en MARL para estudiar la emergencia de estrategias cooperativas o competitivas basadas en el historial de interacciones entre agentes.

📖

términos

Redes de Agentes Adversarios (GANs Multiagentes)

Aplicación de las redes generativas antagónicas en la que varios agentes (generadores y discriminadores) compiten, cada uno aprendiendo a mejorar su desempeño en respuesta a las estrategias de los demás.

📖

términos

Aprendizaje por Refuerzo Jerárquico Multiagente

Enfoque que estructura el aprendizaje en varios niveles, donde agentes de alto nivel definen subtareas para agentes de bajo nivel, facilitando la resolución de problemas complejos y la coordinación.

📖

términos

Estabilidad Ambiental

Problema en MARL donde el entorno percibido por un agente cambia constantemente porque los otros agentes aprenden y adaptan sus políticas, haciendo especialmente difícil el aprendizaje de una política óptima.

📖

términos

Exploración vs Explotación en Multiagentes

Dilema complicado por la presencia de otros agentes, donde la exploración de un agente puede ser percibida como ruido o una acción hostil por los demás, y donde la explotación puede depender de las estrategias competitivas.

📖

términos

Aprendizaje por Refuerzo Inverso Multiagente

Técnica en la que los agentes infieren la función de recompensa o las intenciones de otros agentes observando su comportamiento, con el fin de predecir mejor sus acciones y cooperar o competir de manera más efectiva.

📖

términos

Políticas Mixtas

Estrategia en la que un agente elige sus acciones según una distribución de probabilidad, en lugar de hacerlo de manera determinista, esencial para alcanzar un equilibrio de Nash en juegos de suma cero.

📖

términos

Formación de Coaliciones

Proceso dinámico mediante el cual subgrupos de agentes se alían para perseguir un objetivo común, compartiendo recompensas e información para mejorar su desempeño en comparación con una acción individual.

📖

términos

Aprendizaje Continuo Multiagente

Desafío que consiste en permitir que los agentes adapten sus políticas a nuevas tareas o a la llegada/salida de otros agentes sin olvidar el conocimiento previamente adquirido, asegurando la robustez y flexibilidad del sistema.

📖

términos

Metaaprendizaje en MARL

Enfoque que busca entrenar a los agentes para que aprendan cómo aprender de manera efectiva en una variedad de tareas multiagente, permitiéndoles adaptarse rápidamente a nuevos entornos o configuraciones de agentes.

Glosario IA