Glossário IA
O dicionário completo da Inteligência Artificial
Aprendizado Off-Policy
Método de aprendizagem onde o agente aprende uma política ótima enquanto segue outra política de comportamento, permitindo uma melhor exploração.
Redes Alvo
Redes neurais duplicadas com pesos atualizados lentamente para estabilizar o aprendizado fornecendo alvos mais consistentes.
Processo de Ornstein-Uhlenbeck
Processo estocástico usado para gerar ruído temporalmente correlacionado nas ações, favorecendo uma exploração eficiente em espaços contínuos.
Espaço de Ação Contínuo
Ambiente onde as ações podem assumir qualquer valor em um intervalo contínuo, necessitando algoritmos adaptados ao contrário das ações discretas.
Aproximação de Função com Rede Neural
Uso de redes neurais para aproximar funções complexas como políticas ou funções de valor em aprendizado por reforço.
Atualização Suave
Método de atualização gradual das redes alvo usando um coeficiente tau (τ) para misturar lentamente os pesos das redes principais e alvo.
Rede Ator
Rede neural que aprende a mapear diretamente estados para ações ótimas em um espaço de ação contínuo.
Política Determinística
Política que associa uma ação específica a cada estado, ao contrário das políticas estocásticas que retornam distribuições de probabilidade.
Action Noise
Bruit ajouté aux actions produites par l'acteur pour encourager l'exploration de l'espace d'action continu durant l'entraînement.