モデルの展開 (Model Deployment)

📖

用語

モデルのA/Bテスト

2つのバージョンのモデルを異なるユーザーセグメントで同時にテストし、実際の環境での相対的なパフォーマンスを評価する比較デプロイメント技術。

📖

用語

オンライン推論

モデルが最小レイテンシでオンデマンドで個々の予測を処理するリアルタイム推論モード。通常はREST APIまたはgRPC経由で提供される。

📖

用語

バッチ推論

定期的にデータのバッチに対して予測を生成する推論アプローチ。個々のレイテンシよりもスループットを最適化する。

📖

用語

サーバーレス推論

コンピューティングインフラストラクチャがクラウドプロバイダーによって自動的に管理されるデプロイメントアーキテクチャ。使用量に基づく課金と需要に基づく自動スケーリングを特徴とする。

📖

用語

エッジAIデプロイメント

MLモデルをエッジデバイスにデプロイし、ローカルで推論を実行すること。レイテンシとネットワーク依存性を削減し、データの機密性を維持する。

📖

用語

モデルサービング

MLモデルをAPIエンドポイント経由で本番環境の推論に利用可能にするためのインフラストラクチャとプロセス。ローディング、ライフサイクル管理、最適化を含む。

📖

用語

機械学習の自動スケーリング

推論負荷に応じてコンピューティングリソースを動的に適応させるメカニズム。リクエスト数やレイテンシなどの特定のメトリクスを使用する。

📖

用語

モデルの可観測性

本番環境でのモデルの内部状態と動作を理解する能力。デバッグと最適化のために詳細なログ、メトリクス、トレースを活用する。

📖

用語

段階的ロールアウト

新しいモデルの露出を段階的に（10%、25%、50%、100%）増やし、各段階で検証を行う制御された展開戦略。

📖

用語

モデルシリアライゼーション

トレーニング済みモデルを、本番環境での展開と推論のために保存・転送可能な形式（Pickle、ONNX、SavedModelなど）に変換するプロセス。

📖

用語

推論パイプライン

モデルの予測前後に入力データに適用される処理ステップのシーケンス。前処理、推論、後処理を含む。

AI用語集