Aprendizaje por Refuerzo Cuántico
Algoritmo Cuántico de Optimización Aproximada (QAOA) para RL
Aplicación del QAOA para resolver el problema de la optimización de la política, codificando el objetivo de maximización de la recompensa acumulativa en un Hamiltoniano de coste a minimizar.
← Volver