AI用語集
人工知能の完全辞典
236
カテゴリ
3,245
サブカテゴリ
39,334
用語
用語
潜在ディリクレ配分法(LDA)
文書集合から抽象的なトピックを発見する生成確率モデル。各文書がトピックの混合であり、各トピックが単語の分布であると仮定する。
用語
ディリクレ分布
シンプレックス上の多次元確率分布で、LDAのような混合モデルでトピックの比率をモデル化するために事前分布として使用される。
用語
トピックコヒーレンス
生成されたトピックの意味的一貫性を評価する質的指標。参照コーパスにおける最も確率の高い単語の共起を分析する。
用語
文書-トピック行列
各行が文書を表し、各列がその文書におけるトピックの確率分布を表す行列θで、LDAの主な結果。
用語
単語-トピック行列
各トピックにおける単語の確率分布を表す行列φで、各単語が発見された様々なトピックに対する関連性を示す。
用語
ハイパーパラメータアルファ・ベータ
ディリクレ分布のパラメータで、αは文書内のトピックの分散を制御し、βはトピック内の単語の分散を制御する。
用語
折りたたみギブスサンプリング
パラメータθとφが解析的に積分されたギブスサンプリングの最適化された変種で、LDAモデルの収束を大幅に加速する。
用語
オンラインLDA
ミニバッチで文書を処理するLDAの確率的版で、メモリ複雑度を削減しながら大規模コーパスへの適用を可能にする。
用語
階層的ディリクレ過程
LDAの非パラメトリック拡張であり、事前にこの値を指定することなく、データから最適なトピック数を自動的に推論できます。
用語
収束監視
アルゴリズムが定常状態に達したかを判断するために、LDAモデルのパラメータの安定性を反復間で追跡するプロセス。
🔍