Glosario IA
El diccionario completo de la Inteligencia Artificial
UMAP
Approximación y Proyección Uniforme de Variedades, algoritmo de reducción dimensional no lineal que preserva tanto las estructuras locales como globales de los datos en un espacio de baja dimensión.
Variedad diferenciable
Espacio topológico que se parece localmente al espacio euclidiano, basado en la teoría de variedades para modelar la estructura intrínseca de los datos en alta dimensión.
Conjunto simplicial difuso
Estructura matemática que generaliza los conjuntos simpliciales atribuyendo pesos a las relaciones entre puntos, permitiendo una representación difusa de las relaciones de vecindario en UMAP.
Incrustación espectral
Técnica de incrustación basada en la descomposición en valores propios de matrices de similitud, utilizada en UMAP para inicializar la optimización de la proyección.
Disposición dirigida por fuerzas
Algoritmo de visualización que simula fuerzas físicas entre puntos para optimizar su posicionamiento, aplicado en UMAP para minimizar la divergencia entre espacios.
Optimización estocástica
Método de optimización que utiliza muestras aleatorias para minimizar una función de coste, empleada por UMAP para ajustar las coordenadas de baja dimensión.
Estructura local
Relaciones de proximidad inmediata entre puntos de datos en el espacio original, preservadas por UMAP para mantener los agrupamientos naturales de los datos.
Estructura global
Relaciones a gran escala entre clusters y regiones de datos, mantenidas por UMAP para conservar la topología general del conjunto de datos.
Distancia geodésica
Medida de distancia siguiendo la curvatura de la variedad de datos, utilizada por UMAP para calcular las distancias verdaderas entre puntos en el espacio intrínseco.
Vecindario k-más cercano
Conjunto de los k puntos más cercanos a un punto dado según una métrica definida, fundamental para construir el grafo de vecindario en UMAP.
Entropía cruzada
Función de pérdida que mide la divergencia entre distribuciones de probabilidad, optimizada por UMAP para alinear los espacios de alta y baja dimensión.
Aprendizaje de variedades
Paradigma de aprendizaje automático que descubre la estructura de variedad subyacente de los datos, del cual UMAP es una implementación moderna.
Grafo de vecindario
Estructura de datos que representa las relaciones de proximidad entre puntos, construida por UMAP para modelar la topología local de los datos.
Coordenadas baricéntricas
Representación de un punto como combinación ponderada de puntos de referencia, utilizada por UMAP para la inicialización e interpolación de las proyecciones.
Métrica personalizada
Función de distancia definida por el usuario para medir la similitud entre puntos, soportada por UMAP para adaptar el algoritmo a dominios específicos.
Densidad adaptativa
Capacidad de UMAP para ajustar dinámicamente la resolución local en función de la densidad de los datos, preservando las estructuras en las regiones densas y dispersas.
Mínimos locales
Puntos de equilibrio subóptimos en el paisaje de optimización, evitados por UMAP gracias a técnicas de inicialización y optimización avanzadas.
Transformada de Laplace
Operador matemático aplicado sobre el grafo de vecindario en UMAP para capturar las propiedades geométricas y topológicas de los datos.
Hiperparámetro n_neighbors
Parámetro que controla el tamaño del vecindario local en UMAP, influyendo en el equilibrio entre la preservación de estructuras locales y globales.
Hiperparámetro min_dist
Parámetro que regulariza la compacidad de los clústeres en UMAP, controlando la distancia mínima entre puntos en el espacio proyectado.