Glossário IA
O dicionário completo da Inteligência Artificial
Processos de Decisão Markovianos Estocásticos
MDP onde as transições e recompensas seguem distribuições probabilísticas, modelando a incerteza ambiental.
Métodos Monte Carlo em RL
Algoritmos que utilizam amostragem aleatória repetida para estimar os valores de estado-ação em ambientes estocásticos.
Políticas Estocásticas
Estratégias que retornam distribuições de probabilidade sobre as ações em vez de ações determinísticas.
Aprendizagem por Reforço Bayesiana
Abordagem que trata a incerteza sobre os parâmetros do modelo usando distribuições de probabilidade.
Bandidos Estocásticos Multi-braços
Problema de exploração-explotação onde cada braço tem uma distribuição de recompensa estocástica desconhecida.
Métodos Bootstrap em RL
Técnicas que utilizam reamostragem para quantificar a incerteza nas estimativas de valor.
Processos Gaussianos para RL
Uso de processos gaussianos para modelar a incerteza na função de valor ou de transição.
Métodos de Ensemble em RL Estocástico
Combinação de múltiplos estimadores para capturar a incerteza epistêmica na aprendizagem.
Aprendizagem por Reforço Distribucional
Aprendizagem da distribuição completa dos retornos em vez de apenas sua esperança matemática.
Regressão Quantílica DRL
Abordagem específica de RL distribucional usando regressão quantílica para modelar a incerteza.
MDPs Parcialmente Observáveis Estocásticos
Extensão dos MDPs estocásticos com observação parcial, aumentando a incerteza sobre o estado.
Otimização Estocástica em RL
Métodos de otimização que consideram ruído e incerteza nos gradientes e atualizações.