Glosario IA
El diccionario completo de la Inteligencia Artificial
Juego de Suma Cero
Escenario teórico donde la ganancia total de un agente corresponde exactamente a la pérdida de otro, fundamental en el aprendizaje adversarial multi-agente para modelar competencias estrictas.
Algoritmo Minimax
Algoritmo de decisión que maximiza la ganancia mínima posible en situaciones adversariales, utilizado para desarrollar estrategias robustas contra las peores acciones del adversario.
Equilibrio de Nash
Estado estable donde ningún agente puede mejorar su estrategia modificando unilateralmente su comportamiento, crucial para analizar los puntos de equilibrio en el MARL adversarial.
Auto-Juego
Metodología de entrenamiento donde un agente aprende compitiendo contra copias de sí mismo con estrategias evolutivas, eliminando la necesidad de datos externos.
Política Robusta
Política de aprendizaje por refuerzo que mantiene altos rendimientos frente a perturbaciones adversariales o cambios inesperados en el entorno.
Optimización del Peor Caso
Paradigma de optimización que busca maximizar el rendimiento en los escenarios más desfavorables, esencial para desarrollar agentes resilientes a ataques adversariales.
Ataque Adversarial
Acción deliberada de un agente destinada a degradar el rendimiento de otro agente mediante manipulación del entorno o inyección de perturbaciones maliciosas.
Estrategia de Defensa
Conjunto de mecanismos y políticas diseñados para detectar, contrarrestar y recuperarse de ataques adversariales en sistemas multi-agente.
Entorno Adversarial
Entorno de aprendizaje diseñado para presentar activamente desafíos y obstáculos a los agentes, simulando condiciones reales hostiles o impredecibles.
Destilación de Políticas
Técnica de transferencia de conocimientos donde una política compleja aprendida por un agente es comprimida en una forma más simple y eficiente, utilizada frecuentemente después del entrenamiento adversarial.
Aprendizaje por Refuerzo Adversarial
Paradigma de aprendizaje por refuerzo que integra explícitamente agentes adversarios en el proceso de entrenamiento para mejorar la robustez y capacidades de generalización.
Bandido Adversarial Multiagente
Extensión del problema de los bandidos donde múltiples agentes interactúan en un entorno con recompensas potencialmente manipuladas por adversarios.
Aprendizaje por Imitación Adversarial
Enfoque de aprendizaje por imitación que utiliza discriminadores adversariales para evaluar y mejorar la calidad del comportamiento imitado en comparación con expertos.
Pruebas de Robustez
Evaluación sistemática del rendimiento de los agentes frente a escenarios extremos y ataques coordinados para medir su resiliencia e identificar vulnerabilidades.
Perturbación Adversarial
Modificación sutil pero intencional de las observaciones o del entorno diseñada para inducir errores en la toma de decisiones de un agente objetivo.
Incertidumbre Estratégica
Incertidumbre respecto a las intenciones y estrategias futuras de los adversarios, requiriendo enfoques probabilísticos y adaptativos en la toma de decisiones multiagente.
MARL Basado en Teoría de Juegos
Aplicación de la teoría de juegos al aprendizaje por refuerzo multiagente para analizar y optimizar comportamientos estratégicos en contextos competitivos.