Aprendizagem por Conjunto de Modelos
Robustez da Decisão
Capacidade de um agente de manter um desempenho aceitável diante das incertezas do modelo e das variações do ambiente, usando conjuntos para avaliar a confiança das decisões. Crítico para a implantação de agentes de RL em ambientes reais.
← Voltar