Cloud TPU の予約について
このドキュメントでは、次のいずれかをリクエストして、独占的に使用するために Cloud TPU を予約する方法について説明します。
予約は、次のような場合に役立ちます。
- 計画的または想定外の使用量の急増
- 需要の高いリソースの取得
- 長時間実行のトレーニング ジョブと推論ワークロード
- 容量の確実性を必要とするワークロード
予約は、Cloud TPU の使用オプションの 1 つです。詳細については、Cloud TPU の使用オプションをご覧ください。
予約の種類を選択する
Cloud TPU には、カレンダー モードでリクエストする最大 90 日間の将来の予約と、確約利用割引(CUD)が必要な 1 年以上の将来の予約の 2 種類の予約があります。どちらの予約タイプでも、必要なときに指定した期間 TPU を使用できることが高レベルで保証されます。次の表に、予約タイプの違いを示します。
最大 90 日間の将来の予約(カレンダー モード) | 1 年以上の将来の予約 | |
---|---|---|
所要時間 | 1~90 日 | 1~3 年 |
サポートされる TPU バージョン | v5e、v5p、v6e | すべての TPU バージョン |
費用(詳細については、DWS の料金を参照) | オンデマンドよりも最大 30% 低価格 | オンデマンドよりも 30~55% 低価格 |
リクエスト方法 | Compute Engine API または Google Cloud コンソールを使用したセルフサービス | Cloud セールスチームまたはアカウント マネージャーによる手動プロセス |
確約利用割引(CUD) | 非対応 | CUD 必須 |