AI用語集
人工知能の完全辞典
線形回帰
従属変数と1つ以上の独立変数の間の線形関係を、残差の二乗和を最小化することで確立する統計モデル。各変数の係数が予測への影響として直接解釈できるため、このモデルはホワイトボックスと見なされる。
k近傍法(KNN)
特徴空間内のk個の最近傍の多数決に基づいて新しいサンプルを分類する教師あり学習アルゴリズム。決定に使用された近傍を明示的に示すことで予測を説明できるため、このモデルは完全に解釈可能である。
アソシエーションルール
大規模データベースにおける変数間の関係を発見する手法で、通常は支持度と信頼度の測定値を持つIF-THEN形式で表現される。これらのルールは属性間の理解可能な論理的関係を直接表現するため、本質的に解釈可能である。
一般化線形モデル(GLM)
線形回帰の拡張で、正規分布以外の応答分布と非線形リンク関数を可能にしつつ、加法的構造を保持する。各予測子の限界効果を明らかにするために係数を変換できるため、GLMは解釈可能なままである。
一般化加法モデル(GAM)
線形項ではなく個々の変数の滑らかな関数の和として予測を行うGLMの拡張。非線形関係を捕捉しつつ各変数の予測への影響を個別に可視化できるため、GAMは高い解釈性を提供する。
線形判別分析(LDA)
クラス間分散とクラス内分散の比を最大化することで、2つ以上のクラスを最もよく分離する特徴の線形結合を見つける分類手法。解釈性は、特徴空間内で最も識別力のある方向を示す固有ベクトルから得られる。
CART木
分類にはジニ係数を、回帰には平均二乗誤差を使用し、各ノードで二値分割を行う決定木構築アルゴリズム。CART木の二値構造は、決定経路と抽出されたルールの解釈を容易にする。
ID3アルゴリズム
エントロピーに基づく情報ゲインを使用して分割属性を選択する歴史的な決定木構築アルゴリズム。ID3は、各経路が二値または多クラステストに基づく明確な決定ルールを表す、高度に解釈可能な木を生成する。
C4.5アルゴリズム
ID3アルゴリズムの改良版で、多くの値を持つ属性へのバイアスを避けるために情報ゲイン比を使用し、連続属性と欠損値を扱う。C4.5は決定木を最適化しながら、意思決定プロセスの完全な解釈性を維持する。
CHAIDアルゴリズム
カテゴリ変数にはカイ二乗検定、連続変数にはF検定を使用し、二分分割ではなく多分岐分割を行う決定木構築アルゴリズム。CHAIDは特に調査データやマーケティングデータに対して解釈性の高い決定木を生成する。
決定リスト
順序付けられたIF-THENルールのシーケンスとして表現される分類構造。各ルールは順次テストされ、条件が満たされるまで続く。決定リストは複雑な木構造ではなく線形の決定フローを提供するため、決定木よりも優れた解釈性を提供する。
ルールベースモデル
論理ルールの集合を使用して予測を行う分類または回帰システム。多くの場合、包括的集合または決定リストとして組織化される。これらのモデルは、各予測が非専門家でも理解可能な明示的な1つ以上のルールで説明できるため、最も解釈性が高いものの1つである。
単純パーセプトロン
分類誤差に基づいて重みを反復的に調整することで分離超平面を学習する二値線形分類アルゴリズム。シンプルではあるが、各特徴量の重要性と影響の方向を理解するために重みを検査できるため、パーセプトロンは解釈性を維持する。
ポアソン回帰
応答変数がポアソン分布に従うと仮定するカウントデータの回帰モデルで、平均関数には対数リンク関数を使用する。モデルの指数化された係数は、期待されるイベント発生率の乗数として直接解釈できる。
確率的勾配ブースティング(SGB)
単純な解釈可能なモデル(多くの場合浅い木)を組み合わせ、前のモデルの誤差を修正するために各新しいモデルを逐次構築するアンサンブル手法。強力ではあるが、浅い木を使用したSGBは各個々の木の貢献を通じてある程度の解釈性を保持する。