プロビジョンド スループットを購入する

このページでは、プロビジョンド スループットを定期購入する前に考慮すべき詳細、プロビジョンド スループットの注文やその表示に必要な権限、注文とその表示の手順について説明します。

購入前に考慮すべきこと

プロビジョンド スループットを購入するかどうかを判断する際は、次の点を考慮してください。

  • 期間の途中で注文をキャンセルすることはできません。

    プロビジョンド スループットの購入はコミットメントであるため、期間中に注文をキャンセルすることはできません。ただし、購入した GSU の数は増やすことができます。コミットメントを誤って購入した場合や、構成に問題がある場合は、Google Cloud アカウント担当者にお問い合わせください

  • サブスクリプションは自動更新できます。

    注文を送信する際に、サブスクリプションの期間の終了時に自動更新するか、サブスクリプションを終了するかを選択できます。自動更新プロセスはキャンセルできます。自動更新の前にサブスクリプションをキャンセルするには、次の期間の開始の 30 日前までに自動更新をキャンセルしてください。

    月単位のサブスクリプションは、毎月自動的に更新するように設定できます。週単位のプランでは自動更新はサポートされていません。

    詳細については、プロビジョンド スループットの注文を変更するをご覧ください。 Google Cloud アカウント担当者にお問い合わせいただくこともできます。

  • 自動更新の動作、モデル、モデル バージョン、リージョンは、通知の送信後に変更されます。

    プロジェクト、リージョン、モデル、モデル バージョン、自動更新の動作を選択して注文が承認され、有効になると、プロビジョンド スループットが有効になります(使用可能な容量が上限となります)。自動更新の動作、モデル、モデル バージョン、リージョンを変更するには、 Google Cloud コンソールを使用して既存のプロビジョニングされたスループットの注文を変更します。

    すべての変更はベスト エフォートに基づいて処理され、通常は最初のリクエストから 10 営業日以内に完了します。

    モデルの変更は特定のパブリッシャーに限定されます。たとえば、プロビジョニングされたスループットのモデル割り当てを Google Gemini 2.0 Pro から Google Gemini 2.0 Flash に切り替えることはできますが、Google Gemini 2.0 Flash から Anthropic の Claude 3.5 Sonnet v2 に切り替えることはできません。

  • デフォルトでは、超過分は従量課金制で請求されます。

    スループットがプロビジョンド スループットの注文量を超えると、超過分は標準の従量課金制で処理され、請求されます。超過分はリクエストごとに制御できます。詳細については、プロビジョンド スループットを使用するをご覧ください。

料金については、プロビジョンド スループットをご覧ください。

プレビュー モデルのプロビジョンド スループットを購入する

モデルの一般提供バージョンがリリースされていない場合は、プレビュー版の Google モデルのプロビジョニングされたスループットを購入できます。

プレビュー モデルのプロビジョンド スループットの注文が有効で、モデルの一般提供版がリリースされた場合は、次のいずれかを行うことができます。

  • モデルの一般提供版に注文を移動します。注文を一般提供モデルに移行した後は、注文をプレビュー モデルに戻すことはできません。注文の変更の詳細については、プロビジョンド スループットの注文を変更するをご覧ください。

  • または、プレビュー版が安定している限り、モデルのプレビュー版でプロビジョンド スループットを引き続き使用します。安定版モデルと廃止されたモデルの詳細については、モデルのバージョンとライフサイクルをご覧ください。

ロールと権限

次のロールは、Vertex AI プロビジョンド スループットの管理に対する完全なアクセス権を付与します。

  • roles/aiplatform.provisionedThroughputAdmin: Vertex AI プロビジョンド スループット リソースにアクセスできます。

このロールには次の権限が含まれます。

権限 説明
aiplatform.googleapis.com/provisionedThroughputs.create 新しいプロビジョンド スループットの注文を送信します。
aiplatform.googleapis.com/provisionedThroughputs.get 特定のプロビジョンド スループットの注文を表示します。
aiplatform.googleapis.com/provisionedThroughputs.list プロビジョンド スループットの注文をすべて表示します。
aiplatform.googleapis.com/provisionedThroughputs.update プロビジョンド スループットの注文を変更します。
aiplatform.googleapis.com/provisionedThroughputs.cancel 保留中の注文または保留中の更新をキャンセルします。

プロビジョンド スループットを注文する

Imagen の一部の機能は一般公開されていない場合があります。詳細については、制限付き一般提供とプレビュー版の機能をご覧ください。

MedLM-large-1.5 を使用する注文を行う前に、 Google Cloud アカウント担当者に連絡してアクセスをリクエストしてください。

QPM が 30,000 を超えると予想される場合は、プロビジョンド スループットの注文を最大化するために、次の情報を使用してデフォルトの Vertex AI システム割り当ての割り当て調整をリクエストします。

  • サービス: Vertex AI API。
  • 名前: Online prediction requests per minute per region
  • サービスタイプ: 割り当て。
  • ディメンション: プロビジョンド スループットを注文したリージョン。
  • : 選択したオンライン予測トラフィックの上限。

プロビジョニングされたスループットの注文は、注文のサイズと利用可能な容量に基づいて処理されます。リクエストされた GSU の数と利用可能な容量によっては、注文の処理に数分から数週間かかることがあります。

プロビジョンド スループットを購入する手順は次のとおりです。

コンソール

  1. Google Cloud コンソールで、[プロビジョンド スループット] ページに移動します。

    [プロビジョンド スループット] に移動

  2. 新しい注文を開始するには、[新しい注文] をクリックします。
  3. 注文名を入力します。
  4. モデルを選択します。
  5. リージョンを選択します。
  6. 購入する生成 AI スケール ユニット(GSU)の数を入力します。

    省略可: 生成 AI スケール ユニット見積もりツールを使用して、必要な GSU の数を見積もることができます。このツールを使用する手順は次のとおりです。

    1. [見積もりツール] をクリックします。
    2. モデルを選択します。
    3. 選択したモデルに基づいて、必要な GSU の数を推定するための詳細を入力します。

      • Gemini 2.5 モデルの場合は、次のように入力します。

        • 保証が必要な推定秒間クエリ数
        • クエリあたりの入力テキスト トークン数
        • クエリあたりの入力画像トークン数
        • クエリあたりの入力動画トークン数
        • クエリあたりの入力音声トークン数
        • クエリあたりの出力レスポンス テキスト トークン数
        • クエリあたりの出力推論テキスト トークン数
      • Gemini 2.5 Flash with Live API モデルの場合は、次のように入力します。

        • 保証が必要な推定秒間クエリ数
        • クエリあたりの入力トークン数
        • クエリあたりの入力音声トークン数
        • クエリあたりの入力動画トークン数
        • クエリあたりの入力セッション メモリトークン数
        • クエリあたりの出力テキスト トークン数
        • クエリあたりの出力音声トークン数
      • Gemini 2.5 Flash-Lite(プレビュー)モデルの場合は、次のように入力します。

        • 保証が必要な推定秒間クエリ数
        • クエリあたりの入力テキスト トークン数
        • クエリあたりの入力画像トークン数
        • クエリあたりの入力動画トークン数
        • クエリあたりの入力音声トークン数
        • クエリあたりの出力テキスト トークン数
      • Gemini 2.0 モデルの場合は、次のように入力します。

        • 保証が必要な推定秒間クエリ数
        • クエリあたりの入力トークン数
        • クエリあたりの入力画像トークン数
        • クエリあたりの入力動画トークン数
        • クエリあたりの入力音声トークン数
        • クエリあたりの出力テキスト トークン数
      • Imagen モデルの場合は、次のように入力します。

        • 秒間クエリ数
        • クエリあたりの出力画像数
    4. 見積もりツールに入力した値を使用する場合は、[計算された値を使用] をクリックします。

  7. 期間を選択します。次のオプションが用意されています。

    • 1 週間
    • 1 か月
    • 3 か月
    • 1 年
  8. 省略可: 期間の開始日時(プレビュー)を選択します。

    注文から 2 週間以内の開始日時を指定できます。開始日時を指定しない場合は、容量が確保でき次第、注文が処理されます。リクエストされた開始日時は、ベスト エフォート方式で処理されます。また、注文のステータスが [承認済み] に設定されるまでは、注文がこれらの日時までに処理されるとは限りません。

    リクエストした開始日が現在の日付に近すぎる場合、注文が承認されて有効化されるまでにリクエストした開始日を過ぎてしまうことがあります。この場合、有効化日から選択した期間に基づいて終了日が調整されます。保留中の注文のキャンセルについては、プロビジョンド スループットの注文を変更するをご覧ください。

  9. [更新] リストで、期間の終了時に注文を自動更新するかどうかを指定します。更新オプションを指定できるのは、期間として [1 か月]、[3 か月]、[1 年] のいずれかを選択した場合のみです。

  10. [続行] をクリックします。

  11. [概要] セクションで、注文の価格とスループットの見積もりを確認します。フォームに記載されている利用規約とリンク先の利用規約をお読みください。

  12. 注文を確定するには、[確定] をクリックします。

    注文の処理には、注文の数量と利用可能な容量に応じて、数分から数週間かかることがあります。注文が処理されると、 Google Cloud コンソールのステータスが [有効] に変わります。注文が有効になってから、その注文に対する請求が行われます。

プロビジョンド スループットの注文を変更する

次の表に、注文のステータスと既存の条件に基づいて、Google Cloud コンソールでプロビジョンド スループットの注文を変更する方法を示します。注文の変更はプレビュー機能であり、コンソールからオンラインで注文した場合にのみ使用できます。オフライン注文の変更については、Google Cloud アカウント担当者にお問い合わせください。

また、 Google Cloud コンソールを使用してモデルまたはモデル バージョンを変更すると、既存の注文が変更され、サブスクリプションの終了日は同じままになります。

注文ステータス アクション Google Cloud コンソールでの手順
確認待ち 注文をキャンセルできます。

注文内容をさらに変更する場合は、保留中の注文をキャンセルして、新たに注文してください。

複数のモデルがある場合、各モデルに同時に設定できる保留中の注文の変更または保留中の注文は 1 つのみです。

Google Cloud コンソールで保留中の注文をキャンセルする手順は次のとおりです。
  1. [プロビジョンド スループット] ページに移動します。
  2. 保留中の注文が配置されている [リージョン] を選択します。
  3. [注文の詳細] ページに移動するには、キャンセルする注文の [注文 ID] をクリックします。
  4. [キャンセル] をクリックします。
  5. [注文をキャンセルしてもよろしいですか?] ダイアログで、[注文をキャンセル] をクリックします。
承認済み 注文を変更することはできません。 注文は有効化待ちです。 現時点では、注文を変更することはできません。 該当なし
有効

注文が 5 日以内に期限切れにならない場合、または自動更新される場合にのみ、次の変更を行うことができます。

  • 既存の注文で GSU を増やします。GSU の増加は、自動更新のスケジュールに関係なく、承認されるとすぐに適用されます。
  • 既存の注文で GSU を減らします。GSU の削減は、次の期間の自動更新時に適用されます。
  • 自動更新を有効または無効にします。
  • モデルまたはモデル バージョンを変更する。
  • リージョンを変更します。
有効期限が 5 日未満で、自動更新が設定されていない有効な注文は変更できません。 Google Cloud コンソールで有効な注文を変更するには、次のいずれかの方法を使用します。
  • [プロビジョンド スループット] ページで、[アクション] 列の記号をクリックし、[編集] をクリックします。
  • [注文の詳細] ページで、[編集] ボタンをクリックします。

注文ステータスを確認

プロビジョンド スループットの注文を送信すると、注文ステータスが次のいずれかになります。

  • 審査待ち: 注文は完了しています。承認は、注文をプロビジョニングするための利用可能な容量に依存するため、注文は審査/ 承認待ち状態になります。保留中の注文のステータスについて詳しくは、 Google Cloud アカウント担当者にお問い合わせください。
  • 承認済み: Google が注文を承認しました。注文は有効化待ちです。注文が承認された後は変更できません。
  • 有効: Google が注文を有効にしました。請求が開始されます。
  • 期限切れ: 注文の有効期限が切れています。

プロビジョンド スループットの注文を表示する

プロビジョンド スループットの注文を表示する手順は次のとおりです。

コンソール

  1. Google Cloud コンソールで、[プロビジョンド スループット] ページに移動します。

    [プロビジョンド スループット] に移動

  2. リージョンを選択します。注文のリストが表示されます。

次のステップ