Glossário IA
O dicionário completo da Inteligência Artificial
Modelo de Mistura Gaussiana
Abordagem probabilística que modela um conjunto de dados como uma combinação linear de várias distribuições gaussianas multivariadas, permitindo identificar subgrupos nos dados.
Algoritmo EM
Método iterativo de estimação de parâmetros que maximiza a verossimilhança em modelos com variáveis latentes, alternando entre as etapas de expectativa e maximização.
Etapa E (Expectativa)
Fase do algoritmo EM que calcula as probabilidades a posteriori de pertencimento de cada observação aos diferentes componentes da mistura, baseada nos parâmetros atuais.
Etapa M (Maximização)
Fase do algoritmo EM que atualiza os parâmetros do modelo (médias, covariâncias, coeficientes de mistura) para maximizar a log-verossimilhança esperada.
Parâmetros de Mistura
Conjunto de parâmetros que definem um GMM, incluindo as médias, matrizes de covariância e coeficientes de mistura para cada componente gaussiano.
Coeficientes de Mistura
Pesos associados a cada componente gaussiano da mistura, representando a probabilidade a priori de que uma observação pertença a esse componente.
Matriz de Responsabilidade
Matriz que contém as probabilidades de pertencimento de cada observação a cada cluster, calculada durante a etapa E do algoritmo EM.
Clustering Suave
Abordagem de clustering onde cada observação pode pertencer a vários clusters com diferentes graus de pertencimento, ao contrário do clustering rígido.
Critério AIC
Critério de informação de Akaike que avalia a qualidade do modelo equilibrando o ajuste aos dados e a complexidade, usado para selecionar o número ótimo de componentes.
Critério BIC
Critério de informação bayesiano que penaliza mais fortemente a complexidade do modelo do que o AIC, favorecendo modelos mais parcimoniosos.
Inicialização K-means
Técnica de inicialização dos parâmetros GMM que utiliza primeiro o algoritmo K-means para obter estimativas iniciais dos centros dos clusters.
Densidade de probabilidade
Função que descreve a probabilidade relativa de observar um valor contínuo, modelada pelos componentes gaussianos em um GMM.
Convergência do EM
Critério de parada do algoritmo EM baseado na variação da log-verossimilhança entre iterações sucessivas caindo abaixo de um limiar predefinido.
Elipse de confiança
Representação gráfica da região que contém uma certa porcentagem de probabilidade para uma distribuição gaussiana multivariada.
Separabilidade dos clusters
Medida do grau de sobreposição entre os diferentes componentes gaussianos da mistura, influenciando a qualidade da segmentação obtida.