Glosario IA
El diccionario completo de la Inteligencia Artificial
Asynchronous Advantage Actor-Critic (A3C)
Arquitectura distribuida donde múltiples agentes se entrenan en paralelo en copias del entorno, muestreando trayectorias decorrelacionadas y acelerando la convergencia.
Soft Actor-Critic (SAC)
Algoritmo off-policy que maximiza a partir de la recompensa esperada y la entropía de la política, favoreciendo la exploración y una mejor robustez al hiperajuste.
Deep Deterministic Policy Gradient (DDPG)
Algoritmo off-policy para espacios de acción continuos que combina DQN y Actor-Critic, utilizando redes objetivo y una política determinista.
Twin Delayed DDPG (TD3)
Mejora del DDPG que utiliza dos redes críticas para reducir el sesgo de sobreestimación y actualizaciones retardadas del actor para aumentar la estabilidad.
Munchausen-RL
Algoritmo que introduce un término de entropía logarítmica en la actualización Q, inspirado en el algoritmo de Munchausen, mejorando la exploración y la estabilidad.