Glossário IA
O dicionário completo da Inteligência Artificial
Latent Dirichlet Allocation (LDA)
Modelo probabilístico generativo que descobre tópicos abstratos em uma coleção de documentos, assumindo que cada documento é uma mistura de tópicos e cada tópico uma distribuição de palavras.
Dirichlet Distribution
Distribuição de probabilidade multivariada sobre o simplex, usada como distribuição a priori em modelos de mistura como o LDA para modelar as proporções dos tópicos.
Topic Coherence
Medida qualitativa que avalia a coesão semântica dos tópicos gerados, analisando as co-ocorrências das palavras mais prováveis em um corpus de referência.
Document-Topic Matrix
Matriz θ onde cada linha representa um documento e cada coluna a distribuição de probabilidade dos tópicos nesse documento, resultado principal do LDA.
Word-Topic Matrix
Matriz φ representando a distribuição de probabilidade das palavras para cada tópico, indicando a relevância de cada palavra para os diferentes temas descobertos.
Hyperparameters Alpha Beta
Parâmetros da distribuição Dirichlet onde α controla a dispersão dos tópicos nos documentos e β a dispersão das palavras nos tópicos.
Collapsed Gibbs Sampling
Variante otimizada do Gibbs Sampling onde os parâmetros θ e φ são integrados analiticamente, acelerando significativamente a convergência do modelo LDA.
Online LDA
Versão estocástica do LDA que processa os documentos por mini-lotes para permitir a aplicação em corpora massivos com complexidade de memória reduzida.
Hierarchical Dirichlet Process
Extensão não paramétrica de LDA que permite inferir automaticamente o número ótimo de tópicos a partir dos dados sem especificar a priori esse valor.
Monitoramento de Convergência
Processo de acompanhamento da estabilidade dos parâmetros do modelo LDA entre iterações sucessivas para determinar quando o algoritmo atingiu um estado estacionário.