Aprendizagem por Reforço Quântico
Algoritmo Quântico Variacional (VQA) para RL
Abordagem híbrida que utiliza um circuito quântico parametrizado (VQC) para aproximar a política ou a função de valor, com os parâmetros otimizados por um algoritmo clássico baseado em gradiente.
← Voltar