Glossário IA
O dicionário completo da Inteligência Artificial
Aprendizagem Ativa por Reforço
Metodologia híbrida que combina os princípios da aprendizagem ativa e da aprendizagem por reforço para otimizar a seleção de amostras a serem anotadas.
Política de Seleção de Amostras
Estratégia determinística ou estocástica que define quais dados solicitar para anotação a fim de maximizar a melhoria do modelo sob restrição orçamentária.
Agente de Aprendizagem por Reforço
Entidade algorítmica que aprende a tomar decisões ótimas de seleção de amostras através da interação com o ambiente de anotação.
Função de Recompensa
Sinal que quantifica a utilidade de cada ação de seleção de amostra, tipicamente baseado na melhoria do desempenho do modelo.
Estado-Ação-Valor
Função Q(s,a) que estima a recompensa cumulativa esperada ao selecionar a ação a a partir do estado s e seguir a política ótima.
Aprendizagem por Reforço Profundo
Extensão da aprendizagem por reforço que utiliza redes neurais profundas para aproximar as funções de valor ou políticas.
Aprendizagem Ativa Baseada na Incerteza
Estratégia onde o agente seleciona preferencialmente as amostras para as quais o modelo apresenta a maior incerteza preditiva.
Seleção Estratégica de Amostras
Processo decisório otimizado que visa identificar subconjuntos de dados que maximizam o ganho informacional por custo de anotação.
Aprendizagem por Reforço Off-Policy
Método que permite aprender uma política ótima seguindo outra política de comportamento, útil para exploração flexível.
Aprendizagem por Reforço Online
Paradigma onde o agente aprende e seleciona amostras simultaneamente durante a anotação, adaptando dinamicamente sua estratégia.
Equilíbrio Aprendizagem-Anotação
Otimização do compromisso entre o tempo dedicado à seleção inteligente e os ganhos potenciais no desempenho do modelo.
Estratégia de Aquisição de Dados
Plano de ação sistemático para identificar e coletar os dados mais relevantes a serem anotados de acordo com critérios predefinidos.
Aprendizagem por Reforço Multiagente
Extensão onde múltiplos agentes colaboram ou competem para otimizar conjuntamente a estratégia de seleção de amostras.
Algoritmo Q-Learning Ativo
Variante do Q-learning adaptada à aprendizagem ativa, onde as ações correspondem à seleção de amostras a serem anotadas.
Política de Exploração Guiada
Estratégia de exploração orientada para as regiões do espaço de dados potencialmente mais informativas para o modelo.
Aprendizagem por Reforço Bayesiana
Método que integra a incerteza na estimativa das funções de valor para uma tomada de decisão mais robusta na seleção de amostras.