Aprendizagem Ativa por Reforço

📖

termos

Aprendizagem Ativa por Reforço

Metodologia híbrida que combina os princípios da aprendizagem ativa e da aprendizagem por reforço para otimizar a seleção de amostras a serem anotadas.

📖

termos

Política de Seleção de Amostras

Estratégia determinística ou estocástica que define quais dados solicitar para anotação a fim de maximizar a melhoria do modelo sob restrição orçamentária.

📖

termos

Agente de Aprendizagem por Reforço

Entidade algorítmica que aprende a tomar decisões ótimas de seleção de amostras através da interação com o ambiente de anotação.

📖

termos

Função de Recompensa

Sinal que quantifica a utilidade de cada ação de seleção de amostra, tipicamente baseado na melhoria do desempenho do modelo.

📖

termos

Estado-Ação-Valor

Função Q(s,a) que estima a recompensa cumulativa esperada ao selecionar a ação a a partir do estado s e seguir a política ótima.

📖

termos

Aprendizagem por Reforço Profundo

Extensão da aprendizagem por reforço que utiliza redes neurais profundas para aproximar as funções de valor ou políticas.

📖

termos

Aprendizagem Ativa Baseada na Incerteza

Estratégia onde o agente seleciona preferencialmente as amostras para as quais o modelo apresenta a maior incerteza preditiva.

📖

termos

Seleção Estratégica de Amostras

Processo decisório otimizado que visa identificar subconjuntos de dados que maximizam o ganho informacional por custo de anotação.

📖

termos

Aprendizagem por Reforço Off-Policy

Método que permite aprender uma política ótima seguindo outra política de comportamento, útil para exploração flexível.

📖

termos

Aprendizagem por Reforço Online

Paradigma onde o agente aprende e seleciona amostras simultaneamente durante a anotação, adaptando dinamicamente sua estratégia.

📖

termos

Equilíbrio Aprendizagem-Anotação

Otimização do compromisso entre o tempo dedicado à seleção inteligente e os ganhos potenciais no desempenho do modelo.

📖

termos

Estratégia de Aquisição de Dados

Plano de ação sistemático para identificar e coletar os dados mais relevantes a serem anotados de acordo com critérios predefinidos.

📖

termos

Aprendizagem por Reforço Multiagente

Extensão onde múltiplos agentes colaboram ou competem para otimizar conjuntamente a estratégia de seleção de amostras.

📖

termos

Algoritmo Q-Learning Ativo

Variante do Q-learning adaptada à aprendizagem ativa, onde as ações correspondem à seleção de amostras a serem anotadas.

📖

termos

Política de Exploração Guiada

Estratégia de exploração orientada para as regiões do espaço de dados potencialmente mais informativas para o modelo.

📖

termos

Aprendizagem por Reforço Bayesiana

Método que integra a incerteza na estimativa das funções de valor para uma tomada de decisão mais robusta na seleção de amostras.

Glossário IA