Glossário IA
O dicionário completo da Inteligência Artificial
Pseudo-rótulos
Rótulos gerados automaticamente por algoritmos de agrupamento para aproximar os rótulos verdadeiros em um contexto de aprendizado auto-supervisionado. Eles permitem transformar dados não rotulados em dados rotulados artificialmente para o treinamento supervisionado.
Agrupamento hierárquico auto-supervisionado
Método de agrupamento que constrói uma hierarquia de clusters aninhados sem supervisão explícita, usado para gerar pseudo-rótulos em diferentes níveis de granularidade. Essa abordagem permite uma exploração multi-escala da estrutura dos dados.
K-means auto-supervisionado
Variante do algoritmo K-means clássico aplicada em um contexto auto-supervisionado para criar pseudo-rótulos a partir de dados não rotulados. Os centros de clusters obtidos servem então como protótipos para o treinamento supervisionado.
DBSCAN adaptativo
Versão aprimorada do DBSCAN que ajusta automaticamente seus parâmetros com base na densidade local dos dados em um contexto auto-supervisionado. Este método permite descobrir clusters de formas variadas e densidades heterogêneas.
Agrupamento espectral semi-supervisionado
Técnica de agrupamento que utiliza os autovalores de uma matriz de similaridade para identificar estruturas de dados, com restrições parciais geradas automaticamente. Ela combina a informação espectral com pseudo-rótulos para melhorar a coerência dos clusters.
Rotulagem fraca automática
Processo de geração de rótulos imprecisos, mas úteis, a partir de características intrínsecas dos dados sem intervenção humana. Esses rótulos fracos servem como sinal de aprendizado para modelos supervisionados robustos.
Aprendizado por contraste auto-supervisionado
Paradigma de aprendizado onde o modelo aprende a distinguir amostras semelhantes (positivas) de amostras dissimilares (negativas) sem rótulos explícitos. Os clusters formados naturalmente fornecem pseudo-rótulos para o treinamento.
Agrupamento baseado em densidade
Família de algoritmos que identificam clusters como regiões densas separadas por regiões de baixa densidade no espaço de características. Essa abordagem é particularmente eficaz para descobrir clusters de formas arbitrárias.
Algoritmo de clustering iterativo
Método de agrupamento que refina progressivamente os pseudo-rótulos através de várias iterações de atribuição e atualização de centroides. Cada iteração melhora a coesão intra-cluster e a separação inter-cluster.
Validação de cluster interna
Conjunto de métricas que avaliam a qualidade dos clusters gerados sem referência a rótulos externos, utilizadas para otimizar os pseudo-rótulos. Essas medidas incluem o coeficiente de silhueta, o índice de Davies-Bouldin e o score de Calinski-Harabasz.
Clustering de alta dimensão
Desafio técnico que consiste em agrupar dados em espaços de dimensionalidade muito elevada onde a noção de distância perde o seu significado. Técnicas especializadas como a redução de dimensionalidade são necessárias para um clustering eficaz.
Redução de dimensionalidade para clustering
Etapa preliminar essencial no clustering auto-supervisionado que transforma os dados num espaço de menor dimensão, preservando a estrutura dos clusters. Melhora a eficiência computacional e a qualidade dos pseudo-rótulos.
Clustering baseado em grafos
Abordagem de agrupamento que modela os dados como um grafo onde os nós representam as amostras e as arestas as similaridades. As comunidades detetadas neste grafo correspondem aos clusters utilizados para gerar os pseudo-rótulos.
Clustering por propagação de afinidade
Algoritmo que identifica exemplares representativos nos dados e atribui cada ponto ao exemplar mais apropriado sem a necessidade de um número predefinido de clusters. Este método é particularmente adequado para descobrir estruturas de dados complexas.
Clustering por misturas gaussianas
Abordagem probabilística que modela os dados como uma mistura de várias distribuições gaussianas, cada componente representando um cluster. As probabilidades de pertença servem como pseudo-rótulos flexíveis para a aprendizagem supervisionada.
Clustering incremental
Método de agrupamento capaz de atualizar os pseudo-rótulos à medida que novos dados chegam, sem a necessidade de um recálculo completo. Esta abordagem é essencial para sistemas de aprendizagem contínua.
Agrupamento multi-visão
Paradigma que integra informações provenientes de múltiplas representações ou perspectivas dos mesmos dados para melhorar a qualidade dos clusters e pseudo-rótulos. Esta abordagem explora a complementaridade entre diferentes visões para uma aprendizagem mais robusta.
Agrupamento profundo
Combinação de redes neurais profundas com algoritmos de agrupamento para aprender representações ótimas e gerar pseudo-rótulos de forma end-to-end. Esta abordagem permite capturar estruturas complexas não lineares nos dados.