AI用語集
人工知能の完全辞典
ベイズの定理
ある事象が発生したことを条件として、別の事象の条件付き確率を計算するための数学的公式であり、単純ベイズ分類器の理論的基礎となる。
条件付き独立性
クラスを条件として特徴間が互いに独立であると仮定する単純ベイズの単純化仮説で、この仮説は実践ではしばしば違反される。
尤度
特定のクラスを条件として与えられた特徴を観測する確率であり、単純ベイズモデルでは個々の確率の積として計算される。
事前確率
特徴を観測する前のクラスへの所属に関する初期確率であり、訓練セットにおけるクラスの相対頻度から推定される。
事後確率
特徴を観測した後のクラスへの所属に関する更新された確率であり、分類に使用されるベイズ計算の最終結果である。
エビデンス
特徴を観測する限界確率を表すベイズの定理の正規化項であり、比較的分類ではしばしば省略される。
多項単純ベイズ分類器
離散的特徴と出現回数に最適化された単純ベイズの変種であり、特にテキスト分類と文書分析に効果的である。
ガウス単純ベイズ分類器
特徴が正規分布に従うと仮定する変種であり、特徴空間における連続データと数値属性に適している。
ベルヌーイ単純ベイズ分類器
特徴を属性の存在または不在を示すバイナリ変数として扱う変種で、キーワードベースの文書分類に理想的です。
ラプラス平滑化
カウントに定数を追加してゼロ確率を回避する正則化手法で、単純ベイズにおける条件付き確率の推定時に不可欠です。
生成モデル
データとラベルの同時分布P(X,Y)を学習するモデルのタイプで、新しいサンプルの生成と条件付き確率の計算を可能にします。
EMアルゴリズム
潜在データを持つモデルでのパラメータ推定のための反復アルゴリズムで、隠れた変数を持つ単純ベイズの変種を訓練するために使用されることがあります。
対数スコア
対数確率を使用して予測品質を評価する指標で、単純ベイズにおける確率の積の計算時に数値的アンダーフローを回避します。
ナイーブ仮定
特徴間の独立性を仮定する単純化された仮定で、非現実的ですが、分類において効率的な計算と優れた実践的性能を可能にします。
特徴ベクトル
観測値の属性のベクトル表現で、単純ベイズにおける条件付き確率の計算が実行される基本的な要素です。
条件付き確率分布
特定のクラスを条件とした特徴の確率を記述する関数で、単純ベイズアプローチでは各属性について独立してモデル化されます。
尤度比
異なるクラス間の条件付き確率の比率で、Naïve Bayesの効率的な実装で冗長な計算を避けるために使用されます。
多クラス分類
Naïve Bayesの2値分類を超えた自然な拡張で、ベイズの定理を使用して各可能なクラスの事後確率を計算します。
カーネル密度推定
ガウス仮定が有効でない場合にNaïve Bayesで確率分布を推定するための代替ノンパラメトリック手法。