Aprendizagem por Reforço Estocástica

📂

subcategorias

Processos de Decisão Markovianos Estocásticos

MDP onde as transições e recompensas seguem distribuições probabilísticas, modelando a incerteza ambiental.

17 termos

📂

subcategorias

Métodos Monte Carlo em RL

Algoritmos que utilizam amostragem aleatória repetida para estimar os valores de estado-ação em ambientes estocásticos.

14 termos

📂

subcategorias

Políticas Estocásticas

Estratégias que retornam distribuições de probabilidade sobre as ações em vez de ações determinísticas.

11 termos

📂

subcategorias

Aprendizagem por Reforço Bayesiana

Abordagem que trata a incerteza sobre os parâmetros do modelo usando distribuições de probabilidade.

9 termos

📂

subcategorias

Bandidos Estocásticos Multi-braços

Problema de exploração-explotação onde cada braço tem uma distribuição de recompensa estocástica desconhecida.

7 termos

📂

subcategorias

Métodos Bootstrap em RL

Técnicas que utilizam reamostragem para quantificar a incerteza nas estimativas de valor.

15 termos

📂

subcategorias

Processos Gaussianos para RL

Uso de processos gaussianos para modelar a incerteza na função de valor ou de transição.

10 termos

📂

subcategorias

Métodos de Ensemble em RL Estocástico

Combinação de múltiplos estimadores para capturar a incerteza epistêmica na aprendizagem.

19 termos

📂

subcategorias

Aprendizagem por Reforço Distribucional

Aprendizagem da distribuição completa dos retornos em vez de apenas sua esperança matemática.

5 termos

📂

subcategorias

Regressão Quantílica DRL

Abordagem específica de RL distribucional usando regressão quantílica para modelar a incerteza.

8 termos

📂

subcategorias

MDPs Parcialmente Observáveis Estocásticos

Extensão dos MDPs estocásticos com observação parcial, aumentando a incerteza sobre o estado.

8 termos

📂

subcategorias

Otimização Estocástica em RL

Métodos de otimização que consideram ruído e incerteza nos gradientes e atualizações.

10 termos

Glossário IA

Processos de Decisão Markovianos Estocásticos

Métodos Monte Carlo em RL

Políticas Estocásticas

Aprendizagem por Reforço Bayesiana

Bandidos Estocásticos Multi-braços

Métodos Bootstrap em RL

Processos Gaussianos para RL

Métodos de Ensemble em RL Estocástico

Aprendizagem por Reforço Distribucional

Regressão Quantílica DRL

MDPs Parcialmente Observáveis Estocásticos

Otimização Estocástica em RL

Nenhum resultado encontrado