AI用語集
人工知能の完全辞典
モデルバージョニング
機械学習モデルのバージョン管理システムで、イテレーションの追跡、パフォーマンスの比較、およびリグレッションの場合に以前のバージョンに戻すことを可能にします。
データバージョンコントロール(DVC)
Gitを拡張して大規模なデータセットとモデルのバージョン管理を行うオープンソースツールで、メタデータをGitに、バイナリファイルをクラウドストレージに保存します。
Git LFS
Git Large File Storageの略で、データセットやモデルなどの大きなファイルをメインのGitリポジトリとは別に保存してバージョン管理できるようにするGitの拡張機能です。
実験トラッキング
機械学習実験の追跡可能性と再現性を確保するため、ハイパーパラメータ、メトリクス、アーティファクト、および結果を体系的に記録するプロセスです。
モデルレジストリ
機械学習モデルのバージョンをメタデータ、デプロイメント状況、パフォーマンス履歴と共に一元的に保存・管理するシステムです。
再現性
同じデータ、コード、パラメータ、実行環境を使用して、機械学習実験の正確に同じ結果を再作成する能力です。
アーティファクトリポジトリ
学習済みモデル、前処理済みデータセット、その他のバイナリファイルを含む機械学習アーティファクトをメタデータ管理と共にバージョン管理して保存するシステムです。
モデルドリフト検出
データパターンの変化によるモデルの劣化を特定するため、パフォーマンスとデータ分布を継続的に監視するプロセスです。
MLにおける継続的インテグレーション (CI/ML)
各コミットでコード、データ、モデルの検証テストを自動化し、MLパイプラインにおける品質と一貫性を確保すること。
継続的トレーニング
データパターンの変化に対してモデルの関連性を維持するため、新しいデータで定期的にモデルの再学習を自動化すること。
モデルモニタリング
異常を検出し、モデルの正常な動作を保証するため、本番環境で予測、パフォーマンス、入力分布を継続的に監視すること。
データプロベナンス
MLパイプラインで使用されるデータの起源、履歴、変換の完全な文書化。監査とコンプライアンスに不可欠。
セマンティックバージョニング
モデルのバージョンのための番号付け規則(X.Y.Z)。Xは主要な変更、Yは機能の追加、Zはマイナーな修正を示す。
レイクハウスアーキテクチャ
MLデータのバージョニングと分析を最適化するため、データレイクの柔軟性とデータウェアハウスの構造化された管理を組み合わせたハイブリッドアーキテクチャ。
モデルベースライン
新バージョンの改善点を評価したり、リグレッションを検出したりするための比較点として使用される参照モデルまたは初期バージョン。