AI用語集
人工知能の完全辞典
コンセプトドリフト
特徴量とターゲットの関係が時間とともに変化する条件付き確率分布P(y|x)の変化であり、予測モデルの適応を必要とする。
バーチャルドリフト
特徴量とターゲットの基本的な関係P(y|x)が変化せずに、入力特徴量の周辺分布P(x)のみが変化すること。
リアルドリフト
特徴量とターゲット変数の関係P(y|x)の根本的な変化であり、モデルの予測性能に直接影響を与える。
DDM(ドリフト検出法)
モデルの誤り率に基づく統計的監視アルゴリズムで、二項分布を用いて性能の有意な変化を検出する。
EDDM(早期ドリフト検出法)
DDMの変種で、誤り率だけでなく連続する誤りの間の平均距離を監視することで、段階的な変化の検出に最適化されている。
ADWIN(適応的ウィンドウ)
可変サイズのスライディングウィンドウを維持し、2つのサブウィンドウの分布を統計的に比較して変化を検出する適応的アルゴリズム。
ページ・ヒンクレーテスト
観測値とその平均値の差の累積に基づく変化検出の統計的テストで、急激なドリフトの識別に効果的。
KS検定(コルモゴロフ・スミルノフ検定)
2つのサンプルの累積分布関数を比較し、それらが同じ分布から来ているかどうかを判断するノンパラメトリック検定。
EWMA(指数加重移動平均)
時系列データの変化を検出するための統計的平滑化手法で、古い観測値に指数的に減少する重みを割り当てる。
ドリフト検出率
ドリフト検出アルゴリズムが正しく識別した実際のドリフトの割合を測定する指標で、検出効率を評価する。
誤警報率
データ分布に実際の変化が発生していない場合に、アルゴリズムが誤ってドリフトを検出した割合。
検出遅延
概念ドリフトが実際に発生してから監視アルゴリズムによって検出されるまでに経過した時間で、システムの応答性を測定する。
ウィンドウベース手法
時間ウィンドウを使用して、最近のデータと過去のデータの統計的分布を比較するドリフト検出アプローチ。
統計的プロセス制御
プロセスを監視・制御するために使用される統計的手法の集合で、データストリームにおけるドリフト検出に適応されている。
変化点検出
時系列データの統計的特性が有意に変化する正確な時点を特定する手法で、ドリフト検出の基礎をなす。
特徴量ドリフト
時間の経過とともに1つまたは複数の入力特徴量の分布P(xi)に生じる変化で、モデルの性能に間接的に影響を与える可能性がある。
事前確率ドリフト
条件付き関係P(y|x)の変更なしに、ターゲット変数の周辺分布P(y)が変化し、クラスのバランスに影響を与えること。
ドリフト検出のためのアンサンブル手法
複数のドリフト検出器またはベースモデルを組み合わせて、変化検出の堅牢性と精度を向上させるアプローチ。
段階的ドリフト
データ分布または変数間の関係における変化が、長期間にわたって徐々に発生する概念ドリフトのタイプ。
急激なドリフト
データ分布または変数間の関係における突然かつ即時の変化であり、迅速な検出とモデルの適応を必要とする。