Aprendizagem por Reforço Causal
Viés de Confusão em RL
Distorção sistemática da estimativa de valores devido a variáveis não observadas que influenciam tanto as ações quanto as recompensas, que a abordagem causal procura corrigir.
← Voltar