割り当てと上限

このドキュメントでは、AI アプリケーションに適用される割り当てとシステムの上限について説明します。

  • 割り当ては、使用できるカウント可能な共有リソースの量を指定します。割り当ては、AI アプリケーションなどの Google Cloud サービスによって定義されます。
  • システムの上限は固定値で、変更できません。

Google Cloud では、割り当てを使用して公平性を確保し、リソースの使用量と可用性の急増を抑えます。割り当ては、 Google Cloud プロジェクトで使用できるGoogle Cloud リソースの量を制限します。割り当ては、ハードウェア、ソフトウェア、ネットワーク コンポーネントなど、さまざまなリソースタイプに適用されます。たとえば、割り当てによって、サービスへの API 呼び出しの数、プロジェクトで同時に使用されるロードバランサの数、作成可能なプロジェクトの数を制限できます。割り当てを適用することで、サービスの過負荷を防ぎ、Google Cloud ユーザーのコミュニティを保護します。割り当ては、自組織で使用している Google Cloud リソースの管理にも役立ちます。

Cloud Quotas システムは次のことを行います。

ほとんどの場合、割り当ての許容量を超えるリソースを消費しようとすると、システムによってリソースへのアクセスがブロックされ、実行しようとしているタスクは失敗します。

割り当ては通常、 Google Cloud プロジェクト レベルで適用されます。あるプロジェクトでリソースを使用しても、別のプロジェクトで使用可能な割り当てに影響することはありません。 Google Cloud プロジェクト内では、すべてのアプリケーションと IP アドレスで割り当てが共有されます。

AI アプリケーション リソースにはシステムの上限もあります。システムの上限は変更できません。

数量に基づく割り当て

次の割り当ては、時間が経過してもリセットされません。代わりに、リソースを解放すると解放されます。デフォルトの割り当てが十分でない場合は、割り当ての増加をリクエストできます。

割り当て
プロジェクトあたりのドキュメント数 10,000,000
プロジェクトあたりのデータストアの数 100*
プロジェクトあたりのエンジンの数 150
プロジェクトあたりの保留中のインポートの長時間実行オペレーションの数 300
プロジェクトあたりの保留中のドキュメント削除長時間実行オペレーションの数 100
プロジェクトあたりのサービング コントロールの数 1,000
サービス構成あたりのブースト サービス提供コントロールの数 100
サービス構成あたりのフィルタ サービス提供コントロールの数 100
サービス構成あたりのリダイレクト サービス提供コントロールの数 100
サービス構成あたりの類義語サービス提供コントロールの数 100
プロジェクトあたりのユーザー イベント数 40,000,000,000
グローバルまたは global のプロジェクトあたりのリージョンごとのデータストア数 100
EU マルチリージョンまたは eu のプロジェクトとロケーションごとのデータストアのリージョン数 100
米国マルチリージョンまたは us のプロジェクトとロケーションごとのデータストアのリージョン数 100
グローバルまたは global のプロジェクトあたりのリージョンごとのドキュメント数 10,000,000
EU マルチリージョンまたは eu のプロジェクトあたりのロケーションあたりのドキュメントのリージョン数 10,000,000
米国マルチリージョンまたは us のプロジェクトあたりのロケーションごとのドキュメントのリージョン数 10,000,000
グローバルまたは global のプロジェクトあたりのリージョンごとのエンジンの数 150
EU マルチリージョンまたは eu のプロジェクトあたりのリージョン エンジン数(ロケーション別) 150
米国マルチリージョンまたは us のプロジェクトあたりのリージョンごとのエンジンの数 150
グローバルまたは global のプロジェクトあたりのリージョンごとのユーザー イベント数 40,000,000,000
EU マルチリージョンまたは eu のプロジェクトあたりのロケーションごとのユーザー イベントのリージョン数 40,000,000,000
米国マルチリージョンまたは us のプロジェクトあたりのロケーションごとのユーザー イベントのリージョン数 40,000,000,000

* 技術的な制限により、データストアの最大割り当てはプロジェクトあたり 500 です。データストアがさらに必要な場合は、新しいプロジェクトを使用します。

技術的な制限により、エンジンあたりの最大割り当てはプロジェクトごとに 500 です。エンジンがさらに必要な場合は、新しいプロジェクトを使用します。

リクエストの割り当て

AI Applications API リクエストには、次の割り当てが適用されます。デフォルトの割り当てが十分でない場合は、割り当ての増加をリクエストできます。

割り当て
1 プロジェクト、1 分あたりの完全なクエリ リクエスト数 300
プロジェクトあたりの会話型検索読み取りリクエスト数(1 分あたり) 300
1 分、1 プロジェクトあたりの会話型検索書き込みリクエスト数 300
プロジェクトあたりのドキュメント一括リクエスト数(インライン インポートや削除など)(1 分あたり) 100
プロジェクトあたりのドキュメント非同期インポート(Cloud Storage、BigQuery など)リクエスト数(1 分あたり) 5
プロジェクトあたりのドキュメント削除リクエスト数(1 分あたり) 100
プロジェクトあたりのドキュメント読み取りリクエスト数(1 分あたり) 300
プロジェクトあたりのドキュメント書き込みリクエスト数(1 分あたり) 12,000
1 日、1 プロジェクトあたりの評価作成リクエスト数 5
プロジェクトあたりの評価読み取りリクエスト数(1 分あたり) 100
プロジェクトあたりの評価書き込みリクエスト数(1 分あたり) 100
1 プロジェクト、1 分あたりの LLM クエリ リクエスト数(検索の要約、複数ターンの検索) 60
1 分あたりの保留中の FHIR または BigQuery ストリーミング書き込みの数 6,000
プロジェクトあたりのサンプル クエリセットの数 100
プロジェクトあたりのランキング API リクエスト数(1 分あたり) 500
1 プロジェクト、1 分あたりの推奨リクエスト数 60,000
プロジェクトあたりのサンプルクエリ読み取りリクエスト数(1 分あたり) 200
プロジェクトあたりのサンプル クエリセット読み取りリクエスト数(1 分あたり) 100
プロジェクトあたりのサンプル クエリセット書き込みリクエスト数(1 分あたり) 100
プロジェクトあたりのサンプルクエリ書き込みリクエスト数(1 分あたり) 200
プロジェクトあたりのスキーマ読み取りリクエスト数(1 分あたり) 100
プロジェクトあたりのスキーマ書き込みリクエスト数(1 分あたり) 100
1 分、1 プロジェクトあたりの検索リクエスト数 300
1 分、1 プロジェクトあたりのユーザー イベント バッチ リクエスト(インポートや削除など) 100
1 分、1 プロジェクト、1 ユーザーあたりのユーザー イベント収集リクエスト数 240
1 分、1 プロジェクトあたりのユーザー イベントの書き込みリクエスト数 60,000

ウェブページのインデックス登録の割り当て

[ウェブサイトの高度なインデックス登録] がオンになっているデータストアがある場合、インデックスに登録するすべてのウェブページは、[割り当て] リストの [プロジェクトあたりのドキュメント数] の割り当てにカウントされます。プロジェクト内のページ数と、そのプロジェクトのページ割り当ては、データストアの [データ] ページの [プロジェクトのページ数と割り当て] フィールドで確認することもできます。

プロジェクトのデータストアにウェブサイトを追加し、そのウェブサイトのウェブページがプロジェクトの割り当てを超えると、ウェブサイトはインデックスに登録されません。データストアにすでにインデックス登録されているウェブサイトがある場合、それらのウェブサイトは引き続き以前と同じようにインデックス登録されます。割り当てのアップグレードはいつでもリクエストできます。

割り当ての増加をリクエストする

通常、割り当てを調整するには Google Cloud コンソールを使用します。詳細については、割り当ての調整をリクエストするをご覧ください。