Vertex AI には、トレーニング済みのモデル アーティファクトから予測と説明を行うため、ビルド済みコンテナとして実行できる Docker コンテナ イメージが用意されています。これらのコンテナは ML フレームワークとフレームワークのバージョンで編成され、HTTP 予測サーバーを使用して最小限の構成で予測を行うことができます。多くの場合、予測用の独自のカスタム コンテナを作成するよりも、ビルド済みコンテナを使用するほうが簡単です。
このドキュメントでは、予測用のビルド済みコンテナの一覧を示します。また、Vertex AI のカスタム トレーニング機能を使用して作成したモデル アーティファクトまたは Vertex AI 外部で作成したモデル アーティファクトと一緒に使用する方法を説明します。
サポート ポリシーとスケジュール
Vertex AI は、セキュリティの脆弱性を最小限に抑えるため、スケジュールに基づいて各フレームワーク バージョンをサポートします。サポート ポリシーのスケジュールを確認して、サポート終了日と利用可能期間に与える影響を確認してください。
使用可能なコンテナ イメージ
次の各コンテナ イメージは、さまざまなロケーションにデータを格納する複数の Artifact Registry リポジトリで利用できます。カスタム トレーニングを行うときは、任意の画像の URI が使用可能であり、各 URI は同じコンテナ イメージを指定しています。Google Cloud コンソールを使用して Model
リソースを作成する場合、Google Cloud コンソールは、レイテンシを低減するために、Vertex AI を使用しているロケーションに最適な URI を選択します。
TensorFlow
ML フレームワークのバージョン | サポートされているアクセラレータ(該当する場合は CUDA のバージョン) | パッチとサポート終了日 | 有効期間の終了 | 対応イメージ |
---|---|---|---|---|
2.13 | CPU のみ | 2024 年 11 月 28 日 | 2025 年 11 月 28 日 |
|
2.13 | GPU(CUDA 12.x) | 2024 年 11 月 28 日 | 2025 年 11 月 28 日 |
|
2.12 | CPU のみ | 2024 年 6 月 30 日 | 2025 年 6 月 30 日 |
|
2.12 | GPU(CUDA 11.x) | 2024 年 6 月 30 日 | 2025 年 6 月 30 日 |
|
2.11 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.11 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.10 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.10 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.9 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.9 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.8 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.8 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.7 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.7 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.6 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.6 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.5 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.5 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.4 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.4 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.3 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.3 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.2 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.2 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.1 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.1 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
1.15 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
1.15 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
最適化された TensorFlow ランタイム
次のコンテナ イメージでは、最適化された TensorFlow ランタイムを使用しています。詳細については、最適化された TensorFlow ランタイムを使用するをご覧ください。
ML フレームワークのバージョン | サポートされているアクセラレータ(該当する場合は CUDA のバージョン) | パッチとサポート終了日 | 有効期間の終了 | サポートされているイメージ |
---|---|---|---|---|
ナイトリー | CPU のみ | 該当なし | 該当なし |
|
ナイトリー | GPU(CUDA 12.x) | 該当なし | 該当なし |
|
ナイトリー | Cloud TPU | 該当なし | 該当なし |
|
2.17 | CPU のみ | 2024 年 7 月 11 日 | 2025 年 7 月 11 日 |
|
2.17 | GPU(CUDA 12.x) | 2024 年 7 月 11 日 | 2025 年 7 月 11 日 |
|
2.17 | Cloud TPU | 2024 年 7 月 11 日 | 2025 年 7 月 11 日 |
|
2.16 | CPU のみ | 2024 年 4 月 26 日 | 2025 年 4 月 26 日 |
|
2.16 | GPU(CUDA 12.x) | 2024 年 4 月 26 日 | 2025 年 4 月 26 日 |
|
2.16 | Cloud TPU | 2024 年 4 月 26 日 | 2025 年 4 月 26 日 |
|
2.15 | CPU のみ | 2024 年 8 月 15 日 | 2025 年 8 月 15 日 |
|
2.15 | GPU(CUDA 12.x) | 2024 年 8 月 15 日 | 2025 年 8 月 15 日 |
|
2.15 | Cloud TPU | 2024 年 8 月 15 日 | 2025 年 8 月 15 日 |
|
2.14 | CPU のみ | 2024 年 8 月 15 日 | 2025 年 8 月 15 日 |
|
2.14 | GPU(CUDA 12.x) | 2024 年 8 月 15 日 | 2025 年 8 月 15 日 |
|
2.13 | CPU のみ | 2024 年 8 月 15 日 | 2025 年 8 月 15 日 |
|
2.13 | GPU(CUDA 11.x) | 2024 年 8 月 15 日 | 2025 年 8 月 15 日 |
|
2.12 | CPU のみ | 2024 年 5 月 15 日 | 2025 年 5 月 15 日 |
|
2.12 | GPU(CUDA 11.x) | 2024 年 5 月 15 日 | 2025 年 5 月 15 日 |
|
2.11 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.11 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.10 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.10 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.9 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.9 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.8 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
2.8 | GPU(CUDA 11.x) | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
PyTorch
ML フレームワークのバージョン | サポートされているアクセラレータ(該当する場合は CUDA のバージョン) | パッチとサポート終了日 | 有効期間の終了 | 対応イメージ |
---|---|---|---|---|
2.1(Python 3.9) | CPU のみ | 2024 年 12 月 1 日 | 2025 年 12 月 1 日 |
|
2.1(Python 3.9) | GPU(CUDA 12.x) | 2024 年 12 月 1 日 | 2025 年 12 月 1 日 |
|
2.1(Python 3.9) | Cloud TPU | 2024 年 12 月 1 日 | 2025 年 12 月 1 日 |
|
2.0(Python 3.9) | CPU のみ | 2024 年 7 月 27 日 | 2025 年 7 月 27 日 |
|
2.0(Python 3.9) | GPU(CUDA 11.x) | 2024 年 7 月 27 日 | 2025 年 7 月 27 日 |
|
1.13(Python 3.8) | CPU のみ | 2024 年 5 月 15 日 | 2025 年 5 月 15 日 |
|
1.13(Python 3.8) | GPU(CUDA 11.x) | 2024 年 5 月 15 日 | 2025 年 5 月 15 日 |
|
1.12 | CPU のみ | 2024 年 5 月 15 日 | 2025 年 5 月 15 日 |
|
1.12 | GPU(CUDA 11.x) | 2024 年 5 月 15 日 | 2025 年 5 月 15 日 |
|
1.11 | CPU のみ | 2024 年 5 月 15 日 | 2025 年 5 月 15 日 |
|
1.11 | GPU(CUDA 11.x) | 2024 年 5 月 15 日 | 2025 年 5 月 15 日 |
|
scikit-learn
ML フレームワークのバージョン | サポートされているアクセラレータ(該当する場合は CUDA のバージョン) | パッチとサポート終了日 | 有効期間の終了 | 対応イメージ |
---|---|---|---|---|
1.3(Python 3.10) | CPU のみ | 2024 年 11 月 28 日 | 2025 年 11 月 28 日 |
|
1.2(Python 3.10) | CPU のみ | 2024 年 6 月 30 日 | 2025 年 6 月 30 日 |
|
1.0 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
0.24 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
0.23 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
0.22 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
0.20 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
XGBoost
ML フレームワークのバージョン | サポートされているアクセラレータ(該当する場合は CUDA のバージョン) | パッチとサポート終了日 | 有効期間の終了 | サポートされているイメージ |
---|---|---|---|---|
1.7(Python 3.10) | CPU のみ | 2024 年 6 月 30 日 | 2025 年 6 月 30 日 |
|
1.6 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
1.5 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
1.4 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
1.3 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
1.2 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
1.1 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
0.90 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
0.82 | CPU のみ | 2023 年 11 月 15 日 | 2024 年 11 月 15 日 |
|
ビルド済みコンテナを使用する
Model
をアップロードするカスタム TrainingPipeline
リソースを作成するとき、またはモデル アーティファクトを Model
としてインポートするときに、予測用のビルド済みコンテナを指定できます。
これらのビルド済みコンテナのいずれかを使用するには、ビルド済みコンテナの要件に適合する 1 つ以上のモデル アーティファクトとしてモデルを保存する必要があります。詳細については、予測用のモデル アーティファクトのエクスポートをご覧ください。
以下のノートブックでは、ビルド済みコンテナを使用して予測を提供する方法を示します。
実行する処理 | ノートブック |
---|---|
ビルド済みコンテナを使用して TensorFlow モデルをトレーニングして提供する | カスタム トレーニングとオンライン予測 |
ビルド済みコンテナを使用して PyTorch モデルを提供する | Vertex AI でビルド済みコンテナを使用して PyTorch モデルを提供する |
ビルド済みコンテナを使用して Stable Diffusion モデルを提供する | Vertex AI での Stable Diffusion モデルのデプロイとホスト |
ノートブック
次のステップ
- 予測を提供するエンドポイントにモデルをデプロイする方法を学習する。