量子强化学习
Quantum Approximate Optimization Algorithm (QAOA) pour le RL
Application du QAOA pour résoudre le problème de l'optimisation de la politique, en encodant l'objectif de maximisation de la récompense cumulative dans un Hamiltonien de coût à minimiser.
← 返回