MLインフラ - AI用語集

📖

用語

グラフィックスレンダリングのために最初に設計されたプロセッサだが、その並列アーキテクチャにより、ディープラーニングアルゴリズムの行列計算を加速するために非常に効率的である。

📖

用語

Googleが開発した特定の集積回路（ASIC）で、特にTensorFlowフレームワークで、行列乗算演算とニューラルネットワークの活性化を加速するように最適化されている。

📖

用語

低コストのクラウドコンピューティングインスタンスで、変動する料金で利用可能であり、プロバイダーによって中断される可能性がある。主に中断に寛容なMLトレーニングタスクで使用される。

📖

用語

インフラストラクチャがワークロードに応じて動的に計算リソース（サーバー、ポッド）の数を調整する能力で、推論サービスのコストとパフォーマンスを最適化する。

📖

用語

本番環境でMLモデルを効率的にデプロイ、サービス、管理するように設計された専門的なツール（例：TensorFlow Serving、TorchServe、Triton Inference Server）で、バージョニングと動的ローディングを管理する。

📖

用語

パブリッククラウドとプライベート（オンプレミス）クラウドの計算リソースを組み合わせたアーキテクチャで、企業がセキュリティ、コスト、パフォーマンスの要件に応じてMLワークロードを柔軟にできるようにする。

📖

用語

データ準備からトレーニング、デプロイまで、複雑なMLワークフローを定義、実行、監視、オーケストレーションするシステム（例：Kubeflow Pipelines、Airflow、Prefect）。

📖

用語

ユーザー、プロジェクト、または名前空間が消費できるCPU、GPU、メモリ、またはストレージの量を制限するクラウド/オンプレミスリソース管理メカニズムで、コスト管理と公平性のために不可欠。

📖

用語

サーバーレス推論サービスまたは新しく読み込まれたモデルへの最初のリクエスト時に観察される初期遅延。これは、リソースのプロビジョニングとモデルのメモリへの読み込みにかかる時間が原因です。

AI用語集