এআই গ্লসারি
কৃত্রিম বুদ্ধিমত্তার সম্পূর্ণ অভিধান
Latent Dirichlet Allocation (LDA)
Modèle probabiliste génératif qui découvre des sujets abstraits dans une collection de documents en supposant que chaque document est un mélange de sujets et chaque sujet une distribution de mots.
Dirichlet Distribution
Distribution de probabilité multivariée sur le simplex utilisée comme distribution a priori dans les modèles de mélanges comme LDA pour modéliser les proportions des sujets.
Topic Coherence
Mesure qualitative évaluant la cohésion sémantique des sujets générés en analysant les co-occurrences des mots les plus probables dans un corpus de référence.
Document-Topic Matrix
Matrice θ où chaque ligne représente un document et chaque colonne la distribution de probabilité des sujets dans ce document, résultat principal de LDA.
Word-Topic Matrix
Matrice φ représentant la distribution de probabilité des mots pour chaque sujet, indiquant la pertinence de chaque mot pour les différents thèmes découverts.
Hyperparameters Alpha Beta
Paramètres de la distribution Dirichlet où α contrôle la dispersion des sujets dans les documents et β la dispersion des mots dans les sujets.
Collapsed Gibbs Sampling
Variante optimisée du Gibbs Sampling où les paramètres θ et φ sont intégrés analytiquement, accélérant significativement la convergence du modèle LDA.
Online LDA
Version stochastique de LDA traitant les documents par mini-batch pour permettre l'application sur des corpus massifs avec une complexité mémoire réduite.
হায়ারার্কিক্যাল ডিরিচলেট প্রসেস
এলডিএ-এর একটি নন-প্যারামেট্রিক এক্সটেনশন যা পূর্বনির্ধারিত মান নির্দিষ্ট না করে ডেটা থেকে স্বয়ংক্রিয়ভাবে সর্বোত্তম বিষয়ের সংখ্যা অনুমান করতে দেয়।
কনভারজেন্স মনিটরিং
অ্যালগরিদম কখন স্থির অবস্থায় পৌঁছেছে তা নির্ধারণ করার জন্য পরপর পুনরাবৃত্তির মধ্যে এলডিএ মডেলের প্যারামিটারগুলির স্থিতিশীলতা পর্যবেক্ষণের প্রক্রিয়া।