UMAP - Glossário IA

📖

termos

Conjunto simplicial difuso

Estrutura matemática utilizada pelo UMAP para representar as relações de vizinhança entre pontos de dados, permitindo uma modelagem flexível das conexões locais no espaço de alta dimensão.

📖

termos

Aprendizagem de variedades

Paradigma de aprendizagem não supervisionada que assume que os dados de alta dimensão residem numa variedade de menor dimensão, procurando descobrir esta estrutura subjacente.

📖

termos

Conectividade local

Capacidade de um método de redução dimensional de manter as relações de vizinhança imediata entre pontos próximos no espaço original após a projeção em baixa dimensão.

📖

termos

Otimização por entropia cruzada

Processo de otimização utilizado pelo UMAP para minimizar a divergência entre as probabilidades de vizinhança nos espaços de alta e baixa dimensão, preservando assim a estrutura topológica.

📖

termos

Número de vizinhos (n_neighbors)

Parâmetro chave do UMAP que controla o equilíbrio entre a preservação da estrutura local e global, determinando o tamanho da vizinhança local considerada para cada ponto de dados.

📖

termos

Distância mínima (min_dist)

Parâmetro UMAP que regula o grau de compacidade dos pontos no espaço de projeção, controlando a distância mínima efetiva entre pontos vizinhos no embedding final.

📖

termos

Métrica de distância

Função matemática utilizada pelo UMAP para medir as similaridades entre pontos no espaço de alta dimensão, influenciando diretamente a estrutura topológica descoberta.

📖

termos

Preservação da estrutura global

Capacidade do UMAP de manter as relações em grande escala entre clusters de dados distantes, evitando o efeito de 'problema de aglomeração' (crowding problem) típico das técnicas t-SNE.

📖

termos

Descida de Gradiente Estocástica

Algoritmo de otimização usado pelo UMAP para ajustar iterativamente as posições dos pontos no espaço de baixa dimensão, minimizando a função de perda.

📖

termos

Análise Topológica de Dados

Ramo da matemática aplicada no qual o UMAP se baseia, estudando as propriedades invariantes sob deformação contínua para compreender a estrutura dos dados.

📖

termos

Função de Perda do UMAP

Função objetivo específica do UMAP que combina forças atrativas para vizinhos e forças repulsivas para pontos não-vizinhos, otimizada via entropia cruzada difusa.

📖

termos

Dimensionalidade Intrínseca

Número mínimo de dimensões necessárias para representar fielmente a estrutura essencial dos dados, conceito chave que o UMAP procura estimar e preservar.

📖

termos

Espectro de Valores Próprios

Conjunto dos valores próprios da matriz laplaciana do grafo de vizinhança, usado pelo UMAP para determinar a estrutura geométrica ótima da projeção.

📖

termos

Força Atrativa-Repulsiva

Mecanismo físico simulado pelo UMAP onde os pontos vizinhos se atraem enquanto os pontos não-vizinhos se repelem, criando uma disposição espacial equilibrada.

📖

termos

Transformada do UMAP

Função de mapeamento aprendida pelo UMAP que permite projetar novos pontos no espaço já calculado sem a necessidade de um recálculo completo do embedding.

Glossário IA

Conjunto simplicial difuso

Aprendizagem de variedades

Conectividade local

Otimização por entropia cruzada

Número de vizinhos (n_neighbors)

Distância mínima (min_dist)

Métrica de distância

Preservação da estrutura global

Descida de Gradiente Estocástica

Análise Topológica de Dados

Função de Perda do UMAP

Dimensionalidade Intrínseca

Espectro de Valores Próprios

Força Atrativa-Repulsiva

Transformada do UMAP

Nenhum resultado encontrado