Aprendizaje por Refuerzo Causal
Sesgo de Confusión en RL
Distorsión sistemática de la estimación de valores debida a variables no observadas que influyen tanto en las acciones como en las recompensas, lo que el enfoque causal busca corregir.
← Volver