Glossário IA
O dicionário completo da Inteligência Artificial
Clusterização Espectral
Técnica de clusterização não supervisionada que utiliza os valores próprios de uma matriz de similaridade para realizar uma redução dimensional antes da clusterização. Este método é particularmente eficaz para identificar estruturas não convexas em dados complexos.
Matriz de Similaridade
Matriz quadrada simétrica onde cada elemento S[i,j] representa o grau de similaridade entre os pontos de dados i e j. Ela constitui a base da clusterização espectral codificando as relações locais entre as observações.
Matriz Laplaciana
Operador diferencial discreto definido como L = D - W, onde D é a matriz de graus e W a matriz de ponderação do grafo. Esta matriz captura a estrutura geométrica dos dados e seus vetores próprios revelam os clusters naturais.
Grafo de Similaridade
Representação gráfica onde os nós correspondem aos pontos de dados e as arestas ponderam sua similaridade. Esta estrutura permite aplicar teorias da teoria dos grafos para descobrir agrupamentos naturais nos dados.
K-means Espectral
Combinação da clusterização espectral com o algoritmo K-means aplicado no espaço dos vetores próprios. Esta abordagem aproveita a redução dimensional da clusterização espectral e a simplicidade de implementação do K-means.
Espaço Próprio
Subespaço vetorial gerado pelos vetores próprios associados a um valor próprio dado. Na clusterização espectral, o espaço próprio dos menores valores próprios não nulos constitui uma nova representação dos dados facilitando a clusterização.
Matriz de Adjacência
Matriz quadrada onde A[i,j] = 1 se uma aresta conecta os vértices i e j no grafo, caso contrário 0. Ela representa a estrutura de conectividade do grafo de similaridade utilizado na clusterização espectral.
Matriz de Graus
Matriz diagonal onde cada elemento diagonal D[i,i] representa a soma dos pesos das arestas incidentes ao vértice i. Esta matriz é essencial para construir a matriz laplaciana e normalizar o grafo de similaridade.
Normalização Espectral
Técnica de normalização da matriz de Laplace para estabilizar os cálculos numéricos e melhorar a qualidade do clustering. A normalização simétrica L_sym = I - D^(-1/2)WD^(-1/2) é comumente usada.
Segmentação Espectral
Aplicação do clustering espectral ao particionamento de imagens ou volumes em regiões coerentes. Este método explora as similaridades espectrais entre pixels para detectar fronteiras naturais nos dados visuais.
Coeficiente de Agrupamento
Medida quantificando a densidade local das conexões ao redor de um nó no grafo. Este coeficiente influencia a construção da matriz de similaridade e pode afetar a qualidade dos clusters identificados pelo clustering espectral.
Grafo K-vizinhos Mais Próximos
Tipo de grafo de similaridade onde cada nó é conectado aos seus k vizinhos mais próximos segundo uma métrica dada. Esta abordagem reduz a densidade do grafo enquanto preserva a estrutura local essencial para o clustering.
Núcleo Gaussiano
Função de similaridade K(x,y) = exp(-||x-y||²/2σ²) usada para calcular os pesos na matriz de similaridade. O parâmetro σ controla a escala de similaridade e influencia a conectividade do grafo.
Matriz Laplaciana Normalizada
Variante da matriz de Laplace normalizada para obter valores próprios no intervalo [0,2]. A forma simétrica L_rw = I - D^(-1)W é particularmente adequada ao clustering de dados de tamanhos variáveis.
Decomposição em Valores Próprios
Processo matemático consistindo em encontrar os valores próprios e vetores próprios de uma matriz. No clustering espectral, esta etapa crucial transforma o problema de clustering em um problema de particionamento num espaço de dimensão reduzida.
Particionamento de Grafo
Problema fundamental consistindo em dividir os vértices de um grafo em conjuntos disjuntos minimizando as conexões entre conjuntos. O clustering espectral resolve este problema usando os vetores próprios da matriz de Laplace.