AI用語集
人工知能の完全辞典
変化検出
データの分布や変数間の関係における統計的に有意な変化を特定するためのアルゴリズムプロセスです。早期に検出することで、モデルのパフォーマンス低下前にモデルの更新をトリガーできます。
漸進的ドリフト
変数間の関係における変化が長期間にわたって徐々に生じるコンセプトドリフトの一種です。この緩やかな変化は、変動が統計的ノイズと混同されやすいため、検出が特に困難になります。
急激なドリフト
非常に短い期間に発生する、データの分布や変数間の関係における突然かつ有意な変化です。急激なドリフトに対しては、モデルのパフォーマンスの大幅な低下を防ぐために、迅速な検出が必要となります。
再発的ドリフト
一時的に消失した後、概念や変数間の関係が周期的に再び現れる現象です。反復するパターンを認識することで、変化を予測し、適応戦略を最適化することが可能になります。
共変量ドリフト
条件付き関係 P(Y|X) が安定している一方で、入力変数の分布が変化するタイプのドリフトです。この現象は、ベイズ的アルゴリズムなど、特徴量の分布に敏感なモデルに特に影響を及ぼします。
事前確率ドリフト
条件付き関係 P(Y|X) は変更されずに、ターゲット変数 P(Y) の周辺分布が変化することです。このドリフトは全体の予測に影響を与えますが、変数間の局所的な関係は維持されます。
オンライン適応
新しいデータが到着するたびに予測モデルを継続的に更新するプロセスであり、コンセプトドリフトに対して迅速に対応することを可能にします。オンライン適応は、モデルの安定性と変化への応答性のバランスを保ちます。
検出遅延
コンセプトドリフトが実際に発生してから、アルゴリズムによってそれが検出されるまでの経過時間を測定する指標です。遅延を最小限に抑えることは、モデルのパフォーマンス低下期間を最小化するために重要です。
偽陽性率
検出アルゴリズムによって生成される偽のドリフトアラートの割合であり、モデルの不必要な更新につながります。この率を最適化することは、感度を確保しながら安定性を維持するために不可欠です。
教師あり検出
実際のラベルを使用して、入力と出力の関係の変化を直接分析するドリフト検出手法です。このアプローチは高い精度を提供しますが、正解データが継続的に利用可能である必要があります。
教師なし検出
ラベルを使用せず、入力データの特徴のみに依存するドリフト検出アプローチであり、通常は統計的分布の変化の分析を通じて行われます。正解データが利用できない場合でも、この方法は適用可能です。