AI用語集
人工知能の完全辞典
モデル回帰テスト
新しいモデルまたはパイプラインの新しいバージョンが、固定されたテストデータセット上でベースラインバージョンと比較してパフォーマンスを低下させないことを確認する自動化された手順。
データドリフト検証
新しい本番データの統計的分布をトレーニングデータの分布と比較し、モデルのパフォーマンスに影響を与える可能性のある重要な変更を検出する自動化されたテスト。
バイアステスト
アルゴリズムの公平性と倫理性を確保するために、モデルの特定の人口統計学的サブグループに対する体系的な偏見を測定し、定量化する自動化された一連のプロセス。
コンプライアンステスト
個人情報保護のためのGDPRなどの現行の規制や標準をモデルとそのデータが遵守していることを確認する自動化された検証。
レイテンシパフォーマンステスト
負荷条件下でのモデルの応答時間を自動的に測定し、本番アプリケーションのリアルタイム要件を満たしていることを保証する。
特徴量の一貫性検証
パイプラインによって計算された特徴量(features)が、モデルが期待するスキーマ、タイプ、値の範囲の制約を遵守していることを確認する自動化されたテスト。
パイプライン安定性テスト
MLパイプラインの全ステップ(前処理、トレーニング、推論)が決定論的に、エラーなく実行されることを確認する自動化された検証。
敵対的攻撃セキュリティテスト
誤った予測を引き起こすように設計された敵対的例(adversarial examples)による攻撃に対するモデルの脆弱性を評価する自動化されたテスト。
単調性テスト
特徴量と予測の間に単調な関係が期待されるモデルにおいて、特徴量の増加が予測の増加(または減少)を引き起こすことを確認する自動化された検証。
データ品質検証
訓練または推論パイプラインに取り込む前に、生データの完全性、一意性、妥当性、一貫性を検証する一連の自動化テスト。
メトリック劣化テスト
モデルの性能メトリック(例:F1スコア、AUC)が本番データで事前に定義されたしきい値を下回った場合にアラートを発生させる継続的な監視。
モデル統合テスト
訓練されたモデルとAPI、データベース、監視サービスなどの他のシステムコンポーネント間の正しい相互作用を検証する自動化。
シャドーテスト
切り替え前にパフォーマンスを比較するため、新しいモデルを本番モデルと並行してデプロイし、同じ実際のトラフィックを受け取るがユーザーに影響を与えない手法。
実験的再現性テスト
固定された乱数シードで同じパイプラインを実行することにより、訓練結果の再現性を検証する自動化プロセスで、変動が最小限で制御されていることを確認。
MLモデルのカナリアテスト
完全なデプロイ前に、新しいモデルバージョンを本番のユーザートラフィックの一部に公開し、実際の条件下での検証を可能にするデプロイ戦略。
パイプライン依存関係テスト
MLパイプラインが必要とするすべてのライブラリ、ソフトウェアバージョン、外部リソースがターゲット実行環境に存在し、互換性があることを検証する自動化。