Gradiente de Política Determinista Profunda (DDPG)
Actor Network
Red neuronal que aprende a mapear directamente los estados a las acciones óptimas en un espacio de acción continuo.
← VolverRed neuronal que aprende a mapear directamente los estados a las acciones óptimas en un espacio de acción continuo.
← Volver