Deep Deterministic Policy Gradient (DDPG)
Action Noise
Bruit ajouté aux actions produites par l'acteur pour encourager l'exploration de l'espace d'action continu durant l'entraînement.
← VoltarBruit ajouté aux actions produites par l'acteur pour encourager l'exploration de l'espace d'action continu durant l'entraînement.
← Voltar