RL Distributivo Multi-Passos
RL Sensível ao Risco
Extensão da aprendizagem por reforço distribucional que otimiza medidas de risco específicas (CVaR, variância) em vez da expectativa isolada.
← Voltar