RL Offline Baseado em Modelo
Quantificação de Incerteza
Técnica que permite estimar a incerteza do modelo dinâmico em regiões fora da distribuição para guiar a exploração e evitar erros catastróficos.
← Voltar