AI用語集
人工知能の完全辞典
事前確率シフト
ターゲット変数(y)の分布の変化で、条件付き分布P(X|y)は一定のまま、モデルの予測に影響を与える。
母集団安定性指数(PSI)
2つのデータセット間(例:訓練vs本番)の分布の差を測定する定量的指標で、データドリフトの検出と定量化に使用される。
コルモゴロフ・スミルノフ(KS)検定
2つのサンプルが同じ分布から来るかどうかを判断するために、累積分布関数を比較するノンパラメトリックな統計的検定。
ヘリンガー距離
0から1の間に範囲が限定された、2つの確率分布間の類似性を測定する指標で、解釈可能な方法でデータドリフトの大きさを定量化するために使用される。
ドリフト検出閾値
ドリフト指標(PSIなど)の事前に定義された閾値で、この値を超えるとデータ劣化のアラートが発せられ、モデルの再評価が必要となる。
参照ウィンドウ
将来の分布と比較してデータドリフトを特定するために使用される、安定した参照基準としての時間期間またはデータセット。
検出ウィンドウ
ドリフト監視の際に参照ウィンドウと比較するために統計量が計算される、本番データ上の移動時間間隔。
特徴量ごとのドリフト検出
分布が変化した特定の特徴を特定し、診断を容易にするために、各個別変数(特徴)のレベルでドリフトを分析すること。
多変量ドリフト検出
複数の特徴の結合分布における変化を同時に分析するアプローチで、単変量レベルでは見えないドリフトを検出できる。
漸増的ドリフト検出
新しいデータが到着するにつれて基準統計を更新する検出方法で、モデルを段階的な変化に適応させる。
適応的ウィンドウ処理
検出された変化率に基づいて検出ウィンドウのサイズが動的に調整される技術で、ドリフトに対する可変的な応答性を可能にする。
ドリフト根本原因分析
データドリフトの根本的な原因を特定することを目的とする調査プロセス(例:プロセスの変更、収集エラー、ユーザー行動の進化)。
モデル再学習トリガー
多くの場合、ドリフト閾値の超過に基づく自動化された条件で、機械学習モデルの再学習または更新プロセスを開始する。
機械学習のための統計的プロセス制御(SPC)
管理図などの産業品質管理手法をモデルメトリクスの監視に適用し、堅牢なドリフト検出を行う。