MLインフラ
コールドスタート
サーバーレス推論サービスまたは新しく読み込まれたモデルへの最初のリクエスト時に観察される初期遅延。これは、リソースのプロビジョニングとモデルのメモリへの読み込みにかかる時間が原因です。
← 戻るサーバーレス推論サービスまたは新しく読み込まれたモデルへの最初のリクエスト時に観察される初期遅延。これは、リソースのプロビジョニングとモデルのメモリへの読み込みにかかる時間が原因です。
← 戻る