シングルゾーン プロビジョンド スループットを使用すると、1 つのゾーンのみが使用可能な特定のリージョンでスループットを予約できます。このオプションは、ML 処理が必要なユースケースにおいて、Gemini モデルの予測可能なパフォーマンスを提供します。
サポートされているモデルとリージョンのリストについては、デプロイとエンドポイントをご覧ください。ML 処理をサポートするリージョンとモデルのリストについては、ML 処理をご覧ください。
シングルゾーン プロビジョンド スループットの機能
このセクションでは、シングルゾーン プロビジョンド スループットの主な機能の概要を説明します。
料金と単位は標準のプロビジョンド スループットと一致: シングルゾーン プロビジョンド スループットでは、標準のプロビジョンド スループットと同じスループットの測定単位(GSU)、料金、条件が使用されます。
シングルゾーン プロビジョンド スループットはリージョン内の ML 処理をサポート: 購入したスループット量を超えるトラフィックも含め、すべてのリクエストは購入したリージョンで処理されます。このトラフィックは、リージョンのバッファ容量を使用して従量課金制の料金で課金されます。
超過をコントロール: 標準のプロビジョンド スループットと同じヘッダーを使用してオーバーフロー トラフィックをコントロールできます。
注文をモニタリング可能: 既存のプロビジョンド スループットのモニタリング機能を使用してシングルゾーン プロビジョンド スループットの注文をモニタリングできます。
制限事項
シングルゾーン プロビジョンド スループットには次の制限があります。
シングルゾーン プロビジョンド スループットは対象サービスには含まれず、Vertex AI サービスレベル契約における Gemini オンライン推論から除外されます。
シングルゾーン プロビジョンド スループットは、バッチ リクエストやファイン チューニングと統合されておらず、サポートされていません。
ML 処理のないリージョンでは、シングルゾーン プロビジョンド スループットのレイテンシが、標準のプロビジョンド スループットや従量課金制よりも大きくなることがあります。
シングルゾーン プロビジョンド スループットを購入する
シングルゾーン プロビジョンド スループットの購入についてサポートが必要な場合は、 Google Cloud アカウント担当者にお問い合わせください。