Glossário IA
O dicionário completo da Inteligência Artificial
Função de Covariância
Função kernel que define a similaridade entre pontos em um processo gaussiano, determinando a estrutura de correlação e as propriedades de suavização do modelo.
GP-MDP
Processo de decisão markoviano onde as recompensas ou transições são modeladas por processos gaussianos, integrando a incerteza na formulação do problema de RL.
Amostragem de Thompson com GP
Método de amostragem de ações baseado em amostras do processo gaussiano posterior, permitindo a exploração guiada pela incerteza.
GP-SARSA
Variante do algoritmo SARSA que utiliza processos gaussianos para modelar a função Q-valor com incerteza na aprendizagem por reforço.
Kernel RBF
Função de base radial gaussiana utilizada como covariância em GPs, garantindo a continuidade e diferenciabilidade das funções modeladas.
GPQ
Função Q aproximada por processo gaussiano, permitindo quantificar a incerteza nas estimativas de valor na aprendizagem por reforço.
GP-PILCO
Framework de RL que utiliza processos gaussianos para aprender a dinâmica do sistema com propagação analítica da incerteza.
Bandit Contextual com GP
Problema de bandit onde as recompensas dependem de um contexto, modelado por processos gaussianos para capturar a incerteza espacial.
GP-MCTS
Busca em Árvore Monte Carlo utilizando processos gaussianos para avaliar os nós com incerteza, melhorando a busca em RL.
GP-MAE
Máximo a Posteriori com estimação da incerteza por processos gaussianos para a estimação de política em aprendizagem por reforço.