AI 词汇表
人工智能完整词典
200
个类别
2,608
个子类别
30,011
个术语
个术语
潜在狄利克雷分配(LDA)
一种生成概率模型,通过假设每个文档是主题的混合体,每个主题是单词的分布,来发现文档集合中的抽象主题。
个术语
狄利克雷分布
在单纯形上的多元概率分布,在混合模型(如LDA)中用作先验分布,用于建模主题比例。
个术语
主题一致性
通过分析参考语料库中最可能单词的共现情况,评估生成主题语义凝聚性的定性度量。
个术语
文档-主题矩阵
矩阵θ,其中每行代表一个文档,每列代表该文档中主题的概率分布,是LDA的主要结果。
个术语
单词-主题矩阵
矩阵φ,表示每个主题的单词概率分布,指示每个单词对不同发现主题的相关性。
个术语
超参数Alpha Beta
狄利克雷分布参数,其中α控制文档中主题的分散程度,β控制主题中单词的分散程度。
个术语
折叠吉布斯采样
吉布斯采样的优化变体,其中参数θ和φ被解析积分,显著加速LDA模型的收敛。
个术语
在线LDA
LDA的随机版本,通过小批量处理文档,允许在内存复杂度降低的情况下应用于大规模语料库。
个术语
分层狄利克雷过程
LDA的非参数扩展,能够从数据中自动推断最优主题数量,无需事先指定该值。
个术语
收敛监测
跟踪LDA模型参数在连续迭代之间的稳定性过程,以确定算法何时达到平稳状态。
🔍