購入前に考慮すべきこと
プロビジョンド スループットを購入するかどうかを判断する際は、次の点を考慮してください。
期間の途中で注文をキャンセルすることはできません。
プロビジョンド スループットの購入はコミットメントであるため、期間中に注文をキャンセルすることはできません。ただし、購入した GSU の数は増やすことができます。コミットメントを誤って購入した場合や、構成に問題がある場合は、Google Cloud アカウント担当者にお問い合わせください。
サブスクリプションは自動更新できます。
注文を送信する際に、サブスクリプションの期間の終了時に自動更新するか、サブスクリプションを終了するかを選択できます。自動更新プロセスはキャンセルできます。自動更新の前にサブスクリプションをキャンセルするには、次の期間の開始の 30 日前までに自動更新をキャンセルしてください。
月単位のサブスクリプションは、毎月自動的に更新するように設定できます。週単位のプランでは自動更新はサポートされていません。
詳細については、プロビジョニングされたスループットの注文を変更するをご覧ください。 Google Cloud アカウント担当者にお問い合わせいただくこともできます。
自動更新の動作、モデル、モデル バージョン、リージョンは、通知の送信後に変更されます。
プロジェクト、リージョン、モデル、モデル バージョン、自動更新動作を選択して注文が承認され、有効になると、プロビジョニングされたスループットが有効になります(利用可能な容量に応じて)。自動更新の動作、モデル、モデル バージョンは、Google Cloud コンソールを使用して変更できます。このコンソールを使用して、既存の注文を変更することもできます。詳細については、プロビジョニングされたスループットの順序を変更するをご覧ください。
地域を変更するには、 Google Cloud アカウント担当者にお問い合わせください。新しい定期購入の終了日を含む新しい注文が必要になる場合があります。
すべての変更はベスト エフォートに基づいて処理され、通常は最初のリクエストから 10 営業日以内に完了します。
モデルの変更は特定のパブリッシャーに限定されます。たとえば、プロビジョニングされたスループットのモデル割り当てを Google Gemini 2.0 Pro から Google Gemini 2.0 Flash に切り替えることはできますが、Google Gemini 2.0 Flash から Anthropic の Claude 3.5 Sonnet v2 に切り替えることはできません。
デフォルトでは、超過分は従量課金制で請求されます。
スループットがプロビジョンド スループットの注文量を超えると、超過分は標準の従量課金制で処理され、請求されます。超過分はリクエストごとに制御できます。詳細については、プロビジョニングされたスループットを使用するをご覧ください。
1 週間の期間でプロビジョニングされたスループットを購入する
プロビジョニング スループットは、月単位の定期購入ではなく 1 週間の期間で購入できます。また、プロビジョニング スループットのアクセス制御フォームを送信した後、注文から 2 週間以内の開始日を指定することもできます。
料金については、プロビジョンド スループットをご覧ください。
ロールと権限
次のロールには、Vertex AI プロビジョニング スループットを管理するための完全アクセス権が付与されます。
roles/aiplatform.provisionedThroughputAdmin
: Vertex AI プロビジョンド スループット リソースにアクセスできます。
このロールには次の権限が含まれます。
権限 | 説明 |
---|---|
aiplatform.googleapis.com/provisionedThroughputs.create |
新しいプロビジョニング スループットの注文を送信します。 |
aiplatform.googleapis.com/provisionedThroughputs.get |
特定のプロビジョニング スループットの注文を表示します。 |
aiplatform.googleapis.com/provisionedThroughputs.list |
プロビジョニングされたスループットのすべての注文を表示します。 |
aiplatform.googleapis.com/provisionedThroughputs.update |
プロビジョニングされたスループットの注文を変更する。 |
aiplatform.googleapis.com/provisionedThroughputs.cancel |
保留中の注文または保留中の更新をキャンセルします。 |
プロビジョンド スループットを注文する
Imagen の一部機能は一般公開されていない場合があります。詳細については、制限付き一般提供とプレビュー版の機能をご覧ください。
MedLM-large-1.5 を使用する注文を行う前に、 Google Cloud アカウント担当者に連絡してアクセスをリクエストしてください。QPM が 30,000 を超えると予想される場合は、プロビジョンド スループットの注文を最大化するために、次の情報を使用してデフォルトの Vertex AI システム割り当ての追加をリクエストします。
- サービス: Vertex AI API。
- 名前:
Online prediction requests per minute per region
- サービスタイプ: 割り当て。
- ディメンション: プロビジョンド スループットを注文したリージョン。
- 値: 選択したオンライン予測トラフィックの上限。
プロビジョニングされたスループットの注文は、注文のサイズと利用可能な容量に基づいて処理されます。リクエストされた GSU の数と利用可能な容量によっては、注文の処理に数分から数週間かかることがあります。
プロビジョンド スループットを購入する手順は次のとおりです。
コンソール
- Google Cloud コンソールで、[プロビジョンド スループット] ページに移動します。
- 新しい注文を開始するには、[新規注文] をクリックします。
- 注文名を入力します。
- モデルを選択します。
- リージョンを選択します。
購入する生成 AI スケール ユニット(GSU)の数を入力します。
省略可: 生成 AI スケール ユニット見積もりツールを使用して、必要な GSU の数を見積もることができます。このツールを使用する手順は次のとおりです。
- [推定ツール] をクリックします。
- モデルを選択します。
選択したモデルに基づいて詳細を入力し、必要な GSU の数を推定します。
Gemini 2.0 モデルの場合は、次のように入力します。
- 保証が必要な推定秒間クエリ数
- クエリあたりの入力トークン数
- クエリあたりの入力画像トークン数
- クエリあたりの入力動画トークン数
- クエリあたりの入力音声トークン数
- クエリあたりの出力テキスト トークン数
Imagen モデルの場合は、次のように入力します。
- 秒間クエリ数
- クエリあたりの出力画像数
見積もりツールに入力した値を使用する場合は、[計算された値を使用] をクリックします。
期間を選択します。次のオプションが用意されています。
- 1 週間(限定公開プレビューで利用可能)
- 1 か月
- 3 か月
- 1 年
省略可: 期間の開始日時(プレビュー)を選択します。
注文から 2 週間以内の開始日時を指定できます。開始日時を指定しない場合は、容量が確保でき次第、注文が処理されます。リクエストされた開始日時は、ベスト エフォート方式で処理されます。また、注文のステータスが [承認済み] に設定されるまでは、注文がこれらの日時までに処理されるとは限りません。
リクエストした開始日が現在の日付に近すぎる場合、注文が承認されて有効化されるまでにリクエストした開始日を過ぎてしまうことがあります。この場合、有効化日から選択した期間に基づいて終了日が調整されます。保留中の注文のキャンセルについては、プロビジョニングされたスループットの注文を変更するをご覧ください。
[更新] リストで、期間の終了時に注文を自動更新するかどうかを指定します。更新オプションを指定できるのは、期間として [1 か月]、[3 か月]、[1 年] を選択した場合のみです。
[続行] をクリックします。
[概要] セクションで、注文の価格とスループットの見積もりを確認します。フォームに記載されている利用規約とリンク先の利用規約をお読みください。
注文を確定するには、[確定] をクリックします。
注文の処理には、注文のサイズと利用可能な容量に応じて数分から数週間かかることがあります。注文が処理されると、Google Cloud コンソールでステータスが [有効] に変わります。注文の請求は、注文が有効になってから行われます。
プロビジョンド スループットの注文を変更する
次の表に、注文のステータスと既存の条件に基づいて、Google Cloud コンソールでプロビジョニング スループットの注文を変更する方法を示します。注文の変更はプレビュー機能であり、コンソールから行われたオンライン注文でのみ利用できます。オフライン注文の変更については、Google Cloud アカウント担当者にお問い合わせください。
また、Google Cloud コンソールを使用してモデルまたはモデル バージョンに加えた変更は、サブスクリプションの終了日を変更せずに既存の注文を変更します。
注文ステータス | アクション | 注 | Google Cloud コンソールでの手順 |
---|---|---|---|
確認待ち | 注文をキャンセルできます。 |
注文内容をさらに変更する場合は、保留中の注文をキャンセルして、新たに注文してください。 複数のモデルがある場合、各モデルに同時に設定できる保留中の注文の変更または保留中の注文は 1 つのみです。 |
Google Cloud コンソールで保留中の注文をキャンセルする手順は次のとおりです。
|
有効 |
既存の注文で GSU を増やすことができます。 自動更新を有効または無効にできます。 モデルまたはモデル バージョンを変更できます。 |
以下の両方の条件が満たされている場合、注文を変更することはできません。
|
Google Cloud コンソールで有効な注文を変更するには、次のいずれかの方法を使用します。
|
注文ステータスを確認
プロビジョンド スループットの注文を送信すると、注文ステータスが次のいずれかになります。
- 審査待ち: 注文は完了しています。承認は、注文をプロビジョニングするための利用可能な容量に依存するため、注文は審査/ 承認待ち状態になります。保留中の注文のステータスについて詳しくは、 Google Cloud アカウント担当者にお問い合わせください。
- 承認済み: Google が注文を承認しました。
- 有効: Google が注文を有効にしました。請求が開始されます。
- 期限切れ: 注文の有効期限が切れています。
プロビジョンド スループットの注文を表示する
プロビジョンド スループットの注文を表示する手順は次のとおりです。
コンソール
- Google Cloud コンソールで、[プロビジョンド スループット] ページに移動します。
- リージョンを選択します。注文のリストが表示されます。