Glossário IA
O dicionário completo da Inteligência Artificial
Conjunto simplicial difuso
Estrutura matemática utilizada pelo UMAP para representar as relações de vizinhança entre pontos de dados, permitindo uma modelagem flexível das conexões locais no espaço de alta dimensão.
Aprendizagem de variedades
Paradigma de aprendizagem não supervisionada que assume que os dados de alta dimensão residem numa variedade de menor dimensão, procurando descobrir esta estrutura subjacente.
Conectividade local
Capacidade de um método de redução dimensional de manter as relações de vizinhança imediata entre pontos próximos no espaço original após a projeção em baixa dimensão.
Otimização por entropia cruzada
Processo de otimização utilizado pelo UMAP para minimizar a divergência entre as probabilidades de vizinhança nos espaços de alta e baixa dimensão, preservando assim a estrutura topológica.
Número de vizinhos (n_neighbors)
Parâmetro chave do UMAP que controla o equilíbrio entre a preservação da estrutura local e global, determinando o tamanho da vizinhança local considerada para cada ponto de dados.
Distância mínima (min_dist)
Parâmetro UMAP que regula o grau de compacidade dos pontos no espaço de projeção, controlando a distância mínima efetiva entre pontos vizinhos no embedding final.
Métrica de distância
Função matemática utilizada pelo UMAP para medir as similaridades entre pontos no espaço de alta dimensão, influenciando diretamente a estrutura topológica descoberta.
Preservação da estrutura global
Capacidade do UMAP de manter as relações em grande escala entre clusters de dados distantes, evitando o efeito de 'problema de aglomeração' (crowding problem) típico das técnicas t-SNE.
Descida de Gradiente Estocástica
Algoritmo de otimização usado pelo UMAP para ajustar iterativamente as posições dos pontos no espaço de baixa dimensão, minimizando a função de perda.
Análise Topológica de Dados
Ramo da matemática aplicada no qual o UMAP se baseia, estudando as propriedades invariantes sob deformação contínua para compreender a estrutura dos dados.
Função de Perda do UMAP
Função objetivo específica do UMAP que combina forças atrativas para vizinhos e forças repulsivas para pontos não-vizinhos, otimizada via entropia cruzada difusa.
Dimensionalidade Intrínseca
Número mínimo de dimensões necessárias para representar fielmente a estrutura essencial dos dados, conceito chave que o UMAP procura estimar e preservar.
Espectro de Valores Próprios
Conjunto dos valores próprios da matriz laplaciana do grafo de vizinhança, usado pelo UMAP para determinar a estrutura geométrica ótima da projeção.
Força Atrativa-Repulsiva
Mecanismo físico simulado pelo UMAP onde os pontos vizinhos se atraem enquanto os pontos não-vizinhos se repelem, criando uma disposição espacial equilibrada.
Transformada do UMAP
Função de mapeamento aprendida pelo UMAP que permite projetar novos pontos no espaço já calculado sem a necessidade de um recálculo completo do embedding.