Glosario IA
El diccionario completo de la Inteligencia Artificial
Distribución de frecuencia
Representación tabular o gráfica del número de ocurrencias de cada valor o clase de una variable cuantitativa o cualitativa, que permite visualizar la estructura de los datos.
Histograma
Gráfico de barras contiguas que representa la distribución de una variable cuantitativa continua, donde la superficie de cada barra es proporcional a la frecuencia de las observaciones en el intervalo correspondiente.
Diagrama de caja y bigotes
Diagrama estadístico que sintetiza la distribución de una variable a través de cinco indicadores: mínimo, primer cuartil, mediana, tercer cuartil y máximo, revelando la simetría y la presencia de valores extremos.
Cuartiles
Valores que dividen un conjunto de datos ordenados en cuatro partes iguales, donde Q1 representa el percentil 25, Q2 la mediana (percentil 50) y Q3 el percentil 75.
Desviación estándar
Medida de dispersión calculada como la raíz cuadrada de la varianza, que cuantifica la dispersión promedio de las observaciones alrededor de la media de la distribución.
Varianza
Promedio de los cuadrados de las desviaciones respecto a la media, que mide la dispersión de los datos y constituye la base para el cálculo de la desviación estándar en análisis univariado.
Media aritmética
Indicador de tendencia central obtenido al dividir la suma de todas las observaciones por su número total, sensible a los valores extremos y apropiado para datos simétricos.
Mediana
Valor central que separa la distribución ordenada en dos partes iguales, robusta frente a valores extremos y particularmente informativa para distribuciones asimétricas.
Moda
Valor o categoría que aparece con mayor frecuencia en una distribución, que puede ser única, múltiple o inexistente según la estructura de los datos.
Rango
Medida de dispersión elemental calculada como la diferencia entre el valor máximo y mínimo de una variable, ofreciendo una primera apreciación de la variabilidad de los datos.
Coeficiente de variación
Ratio de la desviación estándar sobre la media, expresado en porcentaje, permitiendo comparar la dispersión relativa entre variables de escalas diferentes en el análisis univariado.
Asimetría
Coeficiente de asimetría que mide el grado de inclinación de una distribución respecto a su simetría, distinguiendo las distribuciones sesgadas a la izquierda (negativas) de las sesgadas a la derecha (positivas).
Diagrama de barras
Representación gráfica de variables cualitativas o cuantitativas discretas donde la altura de cada barra es proporcional a la frecuencia o al número de casos de cada categoría.
Diagrama circular
Gráfico dividido en sectores angulares proporcionales a las frecuencias relativas de una variable cualitativa, visualizando la composición de un todo en porcentajes.
Diagrama de densidad
Curva suavizada que estima la función de densidad de probabilidad de una variable continua, ofreciendo una visualización alternativa al histograma para identificar las modas y la forma de la distribución.
Rango intercuartílico
Medida robusta de dispersión calculada como la diferencia entre el tercer y primer cuartil (Q3-Q1), representando el rango que contiene el 50% de las observaciones centrales.
Coeficiente de asimetría de Pearson
Índice de asimetría basado en la diferencia entre la media y la mediana, normalizado por la desviación estándar, que ofrece una medida alternativa de la asimetría particularmente intuitiva.
Valores atípicos
Observaciones extremas que se desvían significativamente del patrón general de los datos, identificadas mediante métodos como el rango intercuartílico (1.5×IQR) o el puntaje Z.