Glossário IA
O dicionário completo da Inteligência Artificial
Distribuição de frequência
Representação tabular ou gráfica do número de ocorrências de cada valor ou classe de uma variável quantitativa ou qualitativa, permitindo visualizar a estrutura dos dados.
Histograma
Gráfico de barras contíguas representando a distribuição de uma variável quantitativa contínua, onde a superfície de cada barra é proporcional à frequência das observações no intervalo correspondente.
Diagrama de caixa
Diagrama estatístico que sintetiza a distribuição de uma variável através de cinco indicadores: mínimo, primeiro quartil, mediana, terceiro quartil e máximo, revelando a simetria e a presença de valores extremos.
Quartis
Valores que dividem um conjunto de dados ordenados em quatro partes iguais, onde Q1 representa o 25º percentil, Q2 a mediana (50º percentil) e Q3 o 75º percentil.
Desvio padrão
Medida de dispersão calculada como a raiz quadrada da variância, quantificando a dispersão média das observações em torno da média da distribuição.
Variância
Média dos quadrados dos desvios em relação à média, medindo a dispersão dos dados e constituindo a base do cálculo do desvio padrão na análise univariada.
Média aritmética
Indicador de tendência central obtido dividindo a soma de todas as observações pelo seu número total, sensível a valores extremos e apropriado para dados simétricos.
Mediana
Valor central que separa a distribuição ordenada em duas partes iguais, robusta a valores extremos e particularmente informativa para distribuições assimétricas.
Moda
Valor ou categoria que aparece com maior frequência em uma distribuição, podendo ser única, múltipla ou inexistente dependendo da estrutura dos dados.
Amplitude
Medida de dispersão elementar calculada como a diferença entre o valor máximo e mínimo de uma variável, oferecendo uma primeira apreciação da variabilidade dos dados.
Coeficiente de variação
Razão entre o desvio padrão e a média, expresso em porcentagem, permitindo comparar a dispersão relativa entre variáveis de escalas diferentes na análise univariada.
Assimetria
Coeficiente de assimetria medindo o grau de inclinação de uma distribuição em relação à sua simetria, distinguindo distribuições assimétricas à esquerda (negativas) das assimétricas à direita (positivas).
Diagrama de barras
Representação gráfica de variáveis qualitativas ou quantitativas discretas onde a altura de cada barra é proporcional à frequência ou ao efetivo de cada categoria.
Diagrama circular
Gráfico particionado em setores angulares proporcionais às frequências relativas de uma variável qualitativa, visualizando a composição de um todo em porcentagens.
Diagrama de densidade
Curva suavizada estimando a função de densidade de probabilidade de uma variável contínua, oferecendo uma visualização alternativa ao histograma para identificar modas e a forma da distribuição.
Amplitude interquartil
Medida robusta de dispersão calculada como a diferença entre o terceiro e primeiro quartil (Q3-Q1), representando a amplitude que contém 50% das observações centrais.
Coeficiente de Assimetria de Pearson
Índice de assimetria baseado na diferença entre média e mediana, normalizado pelo desvio padrão, oferecendo uma medida alternativa de assimetria particularmente intuitiva.
Valores Atípicos
Observações extremas que se desviam significativamente do padrão geral dos dados, identificadas por métodos como amplitude interquartil (1.5×IQR) ou escore Z.