Glossário IA
O dicionário completo da Inteligência Artificial
t-SNE (t-Distributed Stochastic Neighbor Embedding)
Algoritmo de redução de dimensionalidade não-linear particularmente eficaz para visualizar dados de alta dimensão, focando na preservação de estruturas locais semelhantes.
Número de vizinhos (n_neighbors)
Parâmetro fundamental do UMAP que determina o tamanho da vizinhança local usada para construir a representação do manifold, afetando diretamente a preservação da estrutura.
Força repulsiva
Mecanismo em algoritmos de visualização como t-SNE e UMAP que impede a aglomeração de pontos e preserva a estrutura local dos dados.
Otimização por descida de gradiente
Processo iterativo usado para minimizar a função de custo em t-SNE e UMAP, ajustando progressivamente as posições dos pontos no espaço reduzido.
Estrutura local vs. global
Compromisso fundamental em algoritmos de redução de dimensionalidade entre a preservação das relações de vizinhança próximas e a disposição global dos clusters.
Variedade topológica (Manifold)
Conceito matemático subjacente ao UMAP que assume que os dados de alta dimensão residem em uma superfície de menor dimensão imersa no espaço original.
Grafo de k-vizinhos mais próximos (k-NN)
Estrutura de dados intermediária usada pelo UMAP para modelar as relações de vizinhança antes da projeção no espaço de dimensão reduzida.
Min_distance
Parâmetro UMAP que controla a distância mínima permitida entre os pontos no espaço reduzido, influenciando a compacidade dos clusters resultantes.
Qualidade do embedding
Medida da fidelidade com que a representação de baixa dimensão preserva as relações estruturais dos dados originais.
Embedding estocástico
Natureza probabilística do t-SNE, onde as posições finais podem variar entre execuções, ao contrário das abordagens determinísticas de redução de dimensionalidade.
Otimização por entropia cruzada
Alternativa à divergência de Kullback-Leibler usada em algumas implementações de t-SNE para uma convergência mais estável da otimização.