Aprendizagem por Predição de Trajetórias
Exploração por simulação
Estratégia de exploração onde o agente descobre novas políticas simulando massivamente cenários em seu modelo antes de testar os mais promissores na realidade.
← Voltar