Planificación Multiagente Distribuida
Aprendizaje por Refuerzo Multiagente para la Planificación
Uso de algoritmos de aprendizaje donde cada agente aprende una política de planificación (elección de trayectoria) interactuando con el entorno y los demás agentes, para maximizar una recompensa colectiva o individual.
← Volver