Cloud TPU の予約について
このドキュメントでは、カレンダー モードの将来の予約または確約利用割引に関連付けられた長期予約をリクエストして、独占的に使用するために Cloud TPU を予約する方法について説明します。
予約は、次のような場合に役立ちます。
- 計画的または想定外の使用量の急増
- 需要の高いリソースの取得
- 長時間実行のトレーニング ジョブと推論ワークロード
- 容量の確実性を必要とするワークロード
予約は、Cloud TPU の使用オプションの 1 つです。詳細については、Cloud TPU の使用オプションをご覧ください。
予約の種類を選択する
Cloud TPU には、カレンダー モードの将来の予約(短期)と、確約利用割引(CUD)に関連付けられた長期予約の 2 種類の予約があります。どちらの予約タイプでも、必要なときに指定した期間 TPU を使用できることが高レベルで保証されます。次の表に、カレンダー モードの今後の予約と長期予約の違いを示します。
カレンダー モードの将来の予約(短期) | 長期予約 | |
---|---|---|
期間 | 1~90 日 | 1~3 年 |
サポートされる TPU バージョン | v5e、v5p、v6e | すべての TPU バージョン |
費用(詳細については、DWS の料金を参照) | オンデマンドよりも最大 30% 低価格 | オンデマンドよりも 30~55% 低価格 |
リクエスト方法 | Compute Engine API または Google Cloud コンソールを使用したセルフサービス | Cloud セールスチームまたはアカウント マネージャーによる手動プロセス |
確約利用割引(CUD) | 非対応 | CUD 必須 |