Aprendizaje por Refuerzo Cuántico
Algoritmo Cuántico Variacional (VQA) para RL
Enfoque híbrido que utiliza un circuito cuántico parametrizado (VQC) para aproximar la política o la función de valor, con los parámetros optimizados por un algoritmo clásico basado en el gradiente.
← Volver