Glossário IA
O dicionário completo da Inteligência Artificial
Balanced Random Forest
Variante do Random Forest projetada para lidar com conjuntos de dados desequilibrados, criando árvores de decisão em subamostras bootstrap onde cada classe é representada igualmente.
Bootstrap Equilibrado
Técnica de amostragem onde, para cada iteração, uma amostra bootstrap é retirada de forma a garantir uma representação igual das classes, frequentemente subamostrando a classe majoritária ou superamostrando a classe minoritária.
Subamostragem da Classe Majoritária
Método de redução do desequilíbrio de classes que consiste em remover aleatoriamente observações da classe majoritária para reduzir sua predominância no conjunto de dados de treinamento.
Superamostragem da Classe Minoritária
Técnica que visa aumentar o número de observações da classe minoritária, seja por duplicação, seja pela geração de novas observações sintéticas, para equilibrar a distribuição das classes.
Amostra Bootstrap
Amostra aleatória retirada com reposição do conjunto de dados original, utilizada nos métodos de bagging para treinar cada modelo do conjunto em um subconjunto ligeiramente diferente dos dados.
Pontuação de Gini
Medida da impureza de um nó em uma árvore de decisão, quantificando a probabilidade de uma observação escolhida aleatoriamente no nó ser mal classificada se fosse rotulada aleatoriamente de acordo com a distribuição das classes.
AUC-ROC (Área Sob a Curva Característica de Operação do Receptor)
Métrica de desempenho que mede a capacidade de um classificador de distinguir entre as classes, representando a área sob a curva que traça a taxa de verdadeiros positivos em função da taxa de falsos positivos.
EasyEnsemble
Algoritmo de aprendizado em conjunto que cria múltiplos subconjuntos da classe majoritária, treina um classificador em cada subconjunto combinado com a totalidade da classe minoritária, e agrega as previsões.
BalanceCascade
Método de conjunto iterativo que treina sequencialmente classificadores em conjuntos de dados cada vez mais equilibrados, removendo corretamente os exemplos da classe majoritária que são bem classificados em cada etapa.
Recall (ou Sensibilidade)
Métrica que mede a proporção de observações positivas reais que foram corretamente identificadas pelo modelo, essencial para avaliar o desempenho na classe minoritária.