AI用語集
人工知能の完全辞典
ラッソ回帰
L1正則化手法で、特徴量の絶対係数にペナルティを課し、一部の係数をゼロにすることで自動変数選択を行う。
相互情報量
2つの変数間の依存関係を定量化する統計的尺度で、目的変数に対する特徴量の関連性を評価するために使用される。
カイ二乗検定
カテゴリカル特徴量と目的変数間の独立性を評価する統計的検定で、関連性の低い変数をフィルタリングするために使用される。
分散分析F検定
グループ間の分散を比較して、カテゴリカル目的変数に対する数値特徴量の重要性を評価する統計的手法。
ボルータアルゴリズム
ランダムフォレストに基づく特徴量選択アルゴリズムで、実際の特徴量の重要度をランダムに生成されたシャドー特徴量と比較する。
SelectKBest
特定のテスト(chi2、f_classif、mutual_info_classif)に基づいて最も統計的スコアが高いk個の特徴量を選択する単変量選択手法。
分散しきい値
事前定義されたしきい値より分散が低い特徴量を、情報量が少ないと見なして除去する基本的なフィルタリング技術。
逐次特徴量選択
フォワードまたはバックワード戦略に従って、モデルのパフォーマンス指標を最適化するために特徴量を順次的に追加または削除する欲張りアルゴリズム。
遺伝的アルゴリズムによる特徴選択
自然選択の原理を活用して特徴部分集合の空間を探索し、準最適解を見つけるためのメタヒューリスティックアプローチ。
SHAP値
ゲーム理論に基づく解釈可能性手法で、モデルの個別予測に対する各特徴の影響を定量化します。
相関ベースの特徴選択
特徴間の冗長性を最小化しつつ、特徴と目標変数との相関を分析することで特徴の関連性を評価する手法。
情報利得
特徴が既知の場合の目標変数のエントロピー減少量を定量化し、変数の関連性を評価するために使用される指標。
Reliefアルゴリズム
類似および非類似のインスタンス間の距離を比較して変数の関連性を評価する、フィルタリング型の特徴選択アルゴリズム。
自動特徴選択
手動介入なしで最適な特徴部分集合を特定するために、複数の選択技術を組み合わせる自動化プロセス。
埋め込み手法
決定木や正則化手法など、モデルのトレーニングプロセスに直接統合された特徴選択アプローチ。
ラッパー手法
交差検証や性能指標を通じて特徴部分集合の品質を評価するために機械学習モデルを使用する選択手法。