Balanced Random Forest

📖

termos

Variante do Random Forest projetada para lidar com conjuntos de dados desequilibrados, criando árvores de decisão em subamostras bootstrap onde cada classe é representada igualmente.

📖

termos

Técnica de amostragem onde, para cada iteração, uma amostra bootstrap é retirada de forma a garantir uma representação igual das classes, frequentemente subamostrando a classe majoritária ou superamostrando a classe minoritária.

📖

termos

Subamostragem da Classe Majoritária

Método de redução do desequilíbrio de classes que consiste em remover aleatoriamente observações da classe majoritária para reduzir sua predominância no conjunto de dados de treinamento.

📖

termos

Superamostragem da Classe Minoritária

Técnica que visa aumentar o número de observações da classe minoritária, seja por duplicação, seja pela geração de novas observações sintéticas, para equilibrar a distribuição das classes.

📖

termos

Amostra Bootstrap

Amostra aleatória retirada com reposição do conjunto de dados original, utilizada nos métodos de bagging para treinar cada modelo do conjunto em um subconjunto ligeiramente diferente dos dados.

📖

termos

Pontuação de Gini

Medida da impureza de um nó em uma árvore de decisão, quantificando a probabilidade de uma observação escolhida aleatoriamente no nó ser mal classificada se fosse rotulada aleatoriamente de acordo com a distribuição das classes.

📖

termos

AUC-ROC (Área Sob a Curva Característica de Operação do Receptor)

Métrica de desempenho que mede a capacidade de um classificador de distinguir entre as classes, representando a área sob a curva que traça a taxa de verdadeiros positivos em função da taxa de falsos positivos.

📖

termos

EasyEnsemble

Algoritmo de aprendizado em conjunto que cria múltiplos subconjuntos da classe majoritária, treina um classificador em cada subconjunto combinado com a totalidade da classe minoritária, e agrega as previsões.

📖

termos

BalanceCascade

Método de conjunto iterativo que treina sequencialmente classificadores em conjuntos de dados cada vez mais equilibrados, removendo corretamente os exemplos da classe majoritária que são bem classificados em cada etapa.

📖

termos

Recall (ou Sensibilidade)

Métrica que mede a proporção de observações positivas reais que foram corretamente identificadas pelo modelo, essencial para avaliar o desempenho na classe minoritária.

Glossário IA