Glosario IA
El diccionario completo de la Inteligencia Artificial
Aprendizaje por Refuerzo Multiagente (MARL)
Paradigma de aprendizaje en el que varios agentes interactúan y aprenden simultáneamente en un entorno compartido, a menudo de manera competitiva o cooperativa para maximizar una recompensa colectiva o individual.
Juegos de Suma No Cero
Contexto de interacción en el que las ganancias totales de los agentes no son fijas, permitiendo situaciones de cooperación donde los agentes pueden beneficiarse mutuamente de sus acciones para mejorar la recompensa global.
Q-Learning Descentralizado
Variante del Q-Learning en la que cada agente aprende su propia función de valor Q de manera independiente, sin compartir directamente información sobre las políticas o los valores de otros agentes.
Q-Learning Centralizado con Ejecución Descentralizada (CTDE)
Marco de aprendizaje en el que los agentes utilizan información global (centralizada) durante la fase de entrenamiento para evaluar las acciones, pero toman sus decisiones de manera descentralizada durante la ejecución.
Teoría de Juegos Estocásticos
Extensión de la teoría de juegos a entornos donde las transiciones de estados y las recompensas son probabilísticas, proporcionando un modelo matemático formal para las interacciones multiagente en contextos dinámicos.
Dilema del Prisionero Iterativo
Versión repetida del dilema del prisionero, utilizada en MARL para estudiar la emergencia de estrategias cooperativas o competitivas basadas en el historial de interacciones entre agentes.
Redes de Agentes Adversarios (GANs Multiagentes)
Aplicación de las redes generativas antagónicas en la que varios agentes (generadores y discriminadores) compiten, cada uno aprendiendo a mejorar su desempeño en respuesta a las estrategias de los demás.
Aprendizaje por Refuerzo Jerárquico Multiagente
Enfoque que estructura el aprendizaje en varios niveles, donde agentes de alto nivel definen subtareas para agentes de bajo nivel, facilitando la resolución de problemas complejos y la coordinación.
Estabilidad Ambiental
Problema en MARL donde el entorno percibido por un agente cambia constantemente porque los otros agentes aprenden y adaptan sus políticas, haciendo especialmente difícil el aprendizaje de una política óptima.
Exploración vs Explotación en Multiagentes
Dilema complicado por la presencia de otros agentes, donde la exploración de un agente puede ser percibida como ruido o una acción hostil por los demás, y donde la explotación puede depender de las estrategias competitivas.
Aprendizaje por Refuerzo Inverso Multiagente
Técnica en la que los agentes infieren la función de recompensa o las intenciones de otros agentes observando su comportamiento, con el fin de predecir mejor sus acciones y cooperar o competir de manera más efectiva.
Políticas Mixtas
Estrategia en la que un agente elige sus acciones según una distribución de probabilidad, en lugar de hacerlo de manera determinista, esencial para alcanzar un equilibrio de Nash en juegos de suma cero.
Formación de Coaliciones
Proceso dinámico mediante el cual subgrupos de agentes se alían para perseguir un objetivo común, compartiendo recompensas e información para mejorar su desempeño en comparación con una acción individual.
Aprendizaje Continuo Multiagente
Desafío que consiste en permitir que los agentes adapten sus políticas a nuevas tareas o a la llegada/salida de otros agentes sin olvidar el conocimiento previamente adquirido, asegurando la robustez y flexibilidad del sistema.
Metaaprendizaje en MARL
Enfoque que busca entrenar a los agentes para que aprendan cómo aprender de manera efectiva en una variedad de tareas multiagente, permitiéndoles adaptarse rápidamente a nuevos entornos o configuraciones de agentes.