Glossário IA
O dicionário completo da Inteligência Artificial
Verdadeiro Positivo (TP)
Resultado correto onde o modelo prevê positivamente uma observação que é efetivamente positiva, indicando uma classificação bem-sucedida da classe de interesse. O número de verdadeiros positivos é crucial para avaliar a capacidade do modelo de identificar corretamente os casos relevantes.
Falso Positivo (FP)
Erro de classificação onde o modelo prevê incorretamente uma observação como positiva quando ela é realmente negativa, correspondendo a um alarme falso. Os falsos positivos são particularmente custosos em áreas como diagnóstico médico ou detecção de fraude.
Precisão (Precision)
Métrica calculada como a razão de verdadeiros positivos sobre a soma de verdadeiros e falsos positivos, medindo a proporção de previsões positivas corretas entre todas as previsões positivas. É particularmente importante quando o custo dos falsos positivos é elevado.
Revocação (Recall)
Também chamado de sensibilidade, mede a razão de verdadeiros positivos sobre a soma de verdadeiros positivos e falsos negativos, avaliando a capacidade do modelo de identificar todas as observações positivas reais. A revocação é crucial quando os falsos negativos têm consequências graves.
Curva ROC
Gráfico representando a taxa de verdadeiros positivos em função da taxa de falsos positivos para diferentes limiares de classificação, ilustrando o compromisso entre sensibilidade e especificidade. A área sob esta curva (AUC) quantifica o desempenho geral do classificador.
Regressão Logística
Modelo linear generalizado utilizando a função sigmoide para mapear previsões contínuas a uma probabilidade entre 0 e 1 em classificação binária. Este modelo interpretável é frequentemente usado como base para problemas de classificação dicotômica.
Limiar de Decisão
Valor limite (geralmente 0.5) usado para converter probabilidades de saída em previsões binárias, acima do qual a observação é classificada como positiva. O ajuste deste limiar permite otimizar o compromisso entre precisão e revocação.
Desequilíbrio de Classes
Situação onde uma classe é significativamente mais representada que a outra no conjunto de dados de treinamento, podendo enviesar o modelo para a classe majoritária. Este problema requer técnicas específicas como sobreamostragem ou ponderação de classes.
SMOTE
Técnica de sobreamostragem sintética gerando novos exemplos da classe minoritária por interpolação entre instâncias existentes, equilibrando assim a distribuição das classes sem duplicação exata. SMOTE é particularmente eficaz para melhorar o desempenho em conjuntos de dados desbalanceados.
Árvore de Decisão Binária
Algoritmo de classificação utilizando uma estrutura hierárquica de decisões binárias para particionar o espaço de características em regiões puras, cada folha representando uma classe prevista. As árvores de decisão oferecem grande interpretabilidade, mas são suscetíveis ao sobreajuste.
Especificidade
Medida calculada como a razão de verdadeiros negativos sobre a soma de verdadeiros negativos e falsos positivos, avaliando a capacidade do modelo de identificar corretamente as observações negativas. A especificidade é complementar ao recall e crucial em testes de triagem.