Aprendizagem por Reforço Quântico
Algoritmo de Otimização Aproximada Quântica (QAOA) para RL
Aplicação do QAOA para resolver o problema da otimização da política, codificando o objetivo de maximização da recompensa cumulativa num Hamiltoniano de custo a minimizar.
← Voltar