Classificação Binária

📖

termos

Verdadeiro Positivo (TP)

Resultado correto onde o modelo prevê positivamente uma observação que é efetivamente positiva, indicando uma classificação bem-sucedida da classe de interesse. O número de verdadeiros positivos é crucial para avaliar a capacidade do modelo de identificar corretamente os casos relevantes.

📖

termos

Falso Positivo (FP)

Erro de classificação onde o modelo prevê incorretamente uma observação como positiva quando ela é realmente negativa, correspondendo a um alarme falso. Os falsos positivos são particularmente custosos em áreas como diagnóstico médico ou detecção de fraude.

📖

termos

Precisão (Precision)

Métrica calculada como a razão de verdadeiros positivos sobre a soma de verdadeiros e falsos positivos, medindo a proporção de previsões positivas corretas entre todas as previsões positivas. É particularmente importante quando o custo dos falsos positivos é elevado.

📖

termos

Revocação (Recall)

Também chamado de sensibilidade, mede a razão de verdadeiros positivos sobre a soma de verdadeiros positivos e falsos negativos, avaliando a capacidade do modelo de identificar todas as observações positivas reais. A revocação é crucial quando os falsos negativos têm consequências graves.

📖

termos

Curva ROC

Gráfico representando a taxa de verdadeiros positivos em função da taxa de falsos positivos para diferentes limiares de classificação, ilustrando o compromisso entre sensibilidade e especificidade. A área sob esta curva (AUC) quantifica o desempenho geral do classificador.

📖

termos

Regressão Logística

Modelo linear generalizado utilizando a função sigmoide para mapear previsões contínuas a uma probabilidade entre 0 e 1 em classificação binária. Este modelo interpretável é frequentemente usado como base para problemas de classificação dicotômica.

📖

termos

Limiar de Decisão

Valor limite (geralmente 0.5) usado para converter probabilidades de saída em previsões binárias, acima do qual a observação é classificada como positiva. O ajuste deste limiar permite otimizar o compromisso entre precisão e revocação.

📖

termos

Desequilíbrio de Classes

Situação onde uma classe é significativamente mais representada que a outra no conjunto de dados de treinamento, podendo enviesar o modelo para a classe majoritária. Este problema requer técnicas específicas como sobreamostragem ou ponderação de classes.

📖

termos

SMOTE

Técnica de sobreamostragem sintética gerando novos exemplos da classe minoritária por interpolação entre instâncias existentes, equilibrando assim a distribuição das classes sem duplicação exata. SMOTE é particularmente eficaz para melhorar o desempenho em conjuntos de dados desbalanceados.

📖

termos

Árvore de Decisão Binária

Algoritmo de classificação utilizando uma estrutura hierárquica de decisões binárias para particionar o espaço de características em regiões puras, cada folha representando uma classe prevista. As árvores de decisão oferecem grande interpretabilidade, mas são suscetíveis ao sobreajuste.

📖

termos

Especificidade

Medida calculada como a razão de verdadeiros negativos sobre a soma de verdadeiros negativos e falsos positivos, avaliando a capacidade do modelo de identificar corretamente as observações negativas. A especificidade é complementar ao recall e crucial em testes de triagem.

Glossário IA

Verdadeiro Positivo (TP)

Falso Positivo (FP)

Precisão (Precision)

Revocação (Recall)

Curva ROC

Regressão Logística

Limiar de Decisão

Desequilíbrio de Classes

SMOTE

Árvore de Decisão Binária

Especificidade

Nenhum resultado encontrado