RL Offline Baseado em Modelo
Modelos de Ensemble
Coleção de vários modelos dinâmicos treinados com diferentes inicializações para estimar a incerteza epistêmica pela variância das previsões.
← Voltar