AI用語集
人工知能の完全辞典
不純度獲得 (Impurity Gain)
決定木における変数選択基準で、特定の特徴量に基づいてノードを分割することによる不純度(例:ジニ係数やエントロピー)の削減を測定します。
ジニの重要度 (Gini Importance)
ランダムフォレスト特有の重要度測定で、ある変数がフォレスト内のすべての木にわたってもたらすジニ不純度の平均削減として計算されます。
特徴量再帰 (Feature Recursion)
木ベースのモデルにおける概念で、変数の重要度が他の変数によって作成されたサブツリーを含む複数の深さレベルで選択される能力によって影響されます。
カラム削除重要度 (Drop Column Importance)
変数を削除した後にモデルを再トレーニングし、完全な基準モデルとの性能の低下を測定することで重要度を評価する方法です。
SHAP値 (SHAP Value)
SHAP法によって個々の予測に対する特徴量に割り当てられる定量的スコアで、モデルの予測とデータセットの平均予測の差に対する限界的な貢献を表します。
SHAPフォースプロット (SHAP Force Plot)
単一の観測に対して、各特徴量のSHAP値がモデルの予測を基本値(平均)から最終出力値へとどのように押し進めるかを示すSHAP特有の可視化です。
グローバル重要度とローカル重要度
解釈可能性における基本的な区別で、グローバル重要度は変数がモデル全体に与える影響を評価し、ローカル重要度は特定の予測に対するその貢献を説明します。
重要度による特徴量選択
特徴量の重要度スコアを使用して無関係または冗長な変数を除去し、モデルの性能と解釈可能性を向上させることを目的とした次元削減プロセスです。
LASSO回帰係数
選択の文脈において、LASSOモデル(Least Absolute Shrinkage and Selection Operator)の係数は重要度の指標として機能します。なぜならL1正則化は一部の係数を厳密にゼロにまで縮小し、対応する変数を除去するからです。
代理変数による重要度
木ベースのモデルにおける重要度評価手法で、変数が主要な分割変数の代理としてデータを分割する能力を測定し、冗長だが関連のある情報を示します。
感度分析による重要度
変数の重要度を、その値の変動がモデルの出力にどのように影響するかを分析して評価するアプローチで、多くの場合、偏微分の計算やモンテカルロシミュレーションによって行われます。