Aprendizagem por Conjunto de Modelos
Variância do Ensemble
Métrica que quantifica a dispersão das previsões entre os diferentes modelos de um ensemble, servindo como um proxy direto para a incerteza epistêmica em sistemas de RL Baseado em Modelo. Mais alta em regiões pouco exploradas do espaço de estados.
← Voltar