Glossário IA
O dicionário completo da Inteligência Artificial
Precisão (Precision)
Métrica que avalia a proporção de previsões positivas corretas entre todas as previsões positivas feitas pelo modelo. Mede a qualidade das previsões positivas minimizando os falsos positivos.
Recall (Sensibilidade)
Indicador que mede a capacidade do modelo de identificar corretamente todas as instâncias positivas reais no conjunto de dados. O recall quantifica a completude das previsões positivas reduzindo os falsos negativos.
F1-Score
Média harmônica da precisão e do recall, oferecendo um equilíbrio entre essas duas métricas frequentemente antagônicas. O F1-Score é particularmente útil para classes desequilibradas onde apenas a precisão ou apenas o recall seriam enganosos.
F-beta Score
Generalização do F1-Score que permite ponderar diferentemente a precisão e o recall de acordo com o parâmetro beta. Esta métrica se adapta às necessidades específicas do domínio favorecendo a precisão (beta<1) ou o recall (beta>1).
Matriz de Confusão
Tabela de contingência que resume o desempenho de um modelo de classificação comparando as previsões com os valores reais. Ela decompõe os resultados em verdadeiros positivos, falsos positivos, verdadeiros negativos e falsos negativos para uma análise detalhada.
Verdadeiro Positivo (True Positive)
Instância corretamente classificada como positiva pelo modelo, representando uma previsão bem-sucedida para a classe alvo. Os verdadeiros positivos constituem o numerador no cálculo do recall e contribuem para o denominador da precisão.
Falso Positivo (False Positive)
Instância negativa incorretamente prevista como positiva pelo modelo, correspondendo a um erro do tipo I. Os falsos positivos afetam negativamente a precisão mas não influenciam diretamente o recall da classe positiva.
Verdadeiro Negativo (True Negative)
Instância corretamente identificada como negativa pelo modelo, demonstrando sua capacidade de rejeitar casos não relevantes. Os verdadeiros negativos são essenciais para avaliar a especificidade do modelo nas classes majoritárias.
Falso Negativo (False Negative)
Instância positiva perdida pelo modelo e incorretamente classificada como negativa, representando um erro do tipo II. Os falsos negativos reduzem diretamente o recall e podem ter consequências críticas dependendo do domínio de aplicação.
Precisão Média (Average Precision)
Métrica que resume a curva precisão-recall calculando a média ponderada das precisões em cada limite de recall. É particularmente adequada para a avaliação de sistemas de detecção de objetos e recuperação de informação.
Pontuação AUC-PR
Área sob a curva precisão-recall, medindo o desempenho geral do modelo independentemente do limite de classificação. Ao contrário da AUC-ROC, a AUC-PR é mais sensível ao desempenho nas classes minoritárias.
Sensibilidade (Sensitivity)
Sinônimo de recall, medindo a proporção de casos positivos reais corretamente identificados pelo modelo. A sensibilidade é crucial em aplicações médicas onde a detecção de casos positivos é prioritária.
Especificidade (Specificity)
Capacidade do modelo de identificar corretamente as instâncias negativas, calculada como a razão de verdadeiros negativos sobre o total de negativos reais. A especificidade complementa o recall para avaliar o desempenho em todas as classes.
Acurácia Balanceada (Balanced Accuracy)
Média aritmética da sensibilidade e da especificidade, corrigindo vieses em conjuntos de dados desequilibrados. Esta métrica trata de forma equitativa o desempenho nas classes majoritárias e minoritárias.
Curva Precisão-Recall
Gráfico bidimensional que traça a precisão em função do recall para diferentes limites de classificação. Esta visualização permite analisar o compromisso entre precisão e recall e selecionar o limite ideal.
Pontuação Jaccard
Métrica que mede a similaridade entre dois conjuntos como a razão de sua interseção sobre sua união. Na classificação, a pontuação Jaccard avalia a concordância entre os conjuntos de instâncias previstas como positivas e realmente positivas.
Precisão Top-K
Métrica que avalia a proporção de previsões corretas entre as K previsões mais confiantes do modelo. É particularmente relevante para sistemas de recomendação onde apenas as principais sugestões são apresentadas ao usuário.
Recall Top-K
Extensão do recall tradicional limitado às K previsões mais prováveis do modelo. Esta métrica mede a capacidade do sistema de cobrir instâncias relevantes considerando apenas um subconjunto das previsões totais.