Aprendizagem por Reforço para Otimização
Aprendizagem por Reforço Multiagente
Extensão da aprendizagem por reforço onde múltiplos agentes aprendem simultaneamente, frequentemente em competição ou cooperação, em um ambiente compartilhado.
← Voltar