このドキュメントでは、AI アプリケーションに適用される割り当てとシステムの上限について説明します。
- 割り当ては、使用できるカウント可能な共有リソースの量を指定します。割り当ては、AI アプリケーションなどの Google Cloud サービスによって定義されます。
- システムの上限は固定値で、変更できません。
Google Cloud では、割り当てを使用して公平性を確保し、リソースの使用量と可用性の急増を抑えます。割り当ては、 Google Cloud プロジェクトで使用できるGoogle Cloud リソースの量を制限します。割り当ては、ハードウェア、ソフトウェア、ネットワーク コンポーネントなど、さまざまなリソースタイプに適用されます。たとえば、割り当てによって、サービスへの API 呼び出しの数、プロジェクトで同時に使用されるロードバランサの数、作成可能なプロジェクトの数を制限できます。割り当てを適用することで、サービスの過負荷を防ぎ、Google Cloud ユーザーのコミュニティを保護します。割り当ては、自組織で使用している Google Cloud リソースの管理にも役立ちます。
Cloud Quotas システムは次のことを行います。
- Google Cloud のプロダクトとサービスの消費量をモニタリングする
- これらのリソースの消費量を制限する
- 割り当て値の変更をリクエストし、割り当ての調整を自動化する手段を提供する
ほとんどの場合、割り当ての許容量を超えるリソースを消費しようとすると、システムによってリソースへのアクセスがブロックされ、実行しようとしているタスクは失敗します。
割り当ては通常、 Google Cloud プロジェクト レベルで適用されます。あるプロジェクトでリソースを使用しても、別のプロジェクトで使用可能な割り当てに影響することはありません。 Google Cloud プロジェクト内では、すべてのアプリケーションと IP アドレスで割り当てが共有されます。
AI アプリケーション リソースにはシステムの上限もあります。システムの上限は変更できません。
数量に基づく割り当て
次の割り当ては、時間が経過してもリセットされません。代わりに、リソースを解放すると解放されます。デフォルトの割り当てが十分でない場合は、割り当ての増加をリクエストできます。
割り当て | 値 |
---|---|
プロジェクトあたりのドキュメント数 | 10,000,000 |
プロジェクトあたりのデータストアの数 | 100* |
プロジェクトあたりのエンジンの数 | 150† |
プロジェクトあたりの保留中のインポートの長時間実行オペレーションの数 | 300 |
プロジェクトあたりの保留中のドキュメント削除長時間実行オペレーションの数 | 100 |
プロジェクトあたりのサービング コントロールの数 | 1,000 |
サービス構成あたりのブースト サービス提供コントロールの数 | 100 |
サービス構成あたりのフィルタ サービス提供コントロールの数 | 100 |
サービス構成あたりのリダイレクト サービス提供コントロールの数 | 100 |
サービス構成あたりの類義語サービス提供コントロールの数 | 100 |
プロジェクトあたりのユーザー イベント数 | 40,000,000,000 |
グローバルまたは global のプロジェクトあたりのリージョンごとのデータストア数 |
100 |
EU マルチリージョンまたは eu のプロジェクトとロケーションごとのデータストアのリージョン数 |
100 |
米国マルチリージョンまたは us のプロジェクトとロケーションごとのデータストアのリージョン数 |
100 |
グローバルまたは global のプロジェクトあたりのリージョンごとのドキュメント数 |
10,000,000 |
EU マルチリージョンまたは eu のプロジェクトあたりのロケーションあたりのドキュメントのリージョン数 |
10,000,000 |
米国マルチリージョンまたは us のプロジェクトあたりのロケーションごとのドキュメントのリージョン数 |
10,000,000 |
グローバルまたは global のプロジェクトあたりのリージョンごとのエンジンの数 |
150 |
EU マルチリージョンまたは eu のプロジェクトあたりのリージョン エンジン数(ロケーション別) |
150 |
米国マルチリージョンまたは us のプロジェクトあたりのリージョンごとのエンジンの数 |
150 |
グローバルまたは global のプロジェクトあたりのリージョンごとのユーザー イベント数 |
40,000,000,000 |
EU マルチリージョンまたは eu のプロジェクトあたりのロケーションごとのユーザー イベントのリージョン数 |
40,000,000,000 |
米国マルチリージョンまたは us のプロジェクトあたりのロケーションごとのユーザー イベントのリージョン数 |
40,000,000,000 |
* 技術的な制限により、データストアの最大割り当てはプロジェクトあたり 500 です。データストアがさらに必要な場合は、新しいプロジェクトを使用します。
† 技術的な制限により、エンジンあたりの最大割り当てはプロジェクトごとに 500 です。エンジンがさらに必要な場合は、新しいプロジェクトを使用します。
リクエストの割り当て
AI Applications API リクエストには、次の割り当てが適用されます。デフォルトの割り当てが十分でない場合は、割り当ての増加をリクエストできます。
割り当て | 値 |
---|---|
1 プロジェクト、1 分あたりの完全なクエリ リクエスト数 | 300 |
プロジェクトあたりの会話型検索読み取りリクエスト数(1 分あたり) | 300 |
1 分、1 プロジェクトあたりの会話型検索書き込みリクエスト数 | 300 |
プロジェクトあたりのドキュメント一括リクエスト数(インライン インポートや削除など)(1 分あたり) | 100 |
プロジェクトあたりのドキュメント非同期インポート(Cloud Storage、BigQuery など)リクエスト数(1 分あたり) | 5 |
プロジェクトあたりのドキュメント削除リクエスト数(1 分あたり) | 100 |
プロジェクトあたりのドキュメント読み取りリクエスト数(1 分あたり) | 300 |
プロジェクトあたりのドキュメント書き込みリクエスト数(1 分あたり) | 12,000 |
1 日、1 プロジェクトあたりの評価作成リクエスト数 | 5 |
プロジェクトあたりの評価読み取りリクエスト数(1 分あたり) | 100 |
プロジェクトあたりの評価書き込みリクエスト数(1 分あたり) | 100 |
1 プロジェクト、1 分あたりの LLM クエリ リクエスト数(検索の要約、複数ターンの検索) | 60 |
1 分あたりの保留中の FHIR または BigQuery ストリーミング書き込みの数 | 6,000 |
プロジェクトあたりのサンプル クエリセットの数 | 100 |
プロジェクトあたりのランキング API リクエスト数(1 分あたり) | 500 |
1 プロジェクト、1 分あたりの推奨リクエスト数 | 60,000 |
プロジェクトあたりのサンプルクエリ読み取りリクエスト数(1 分あたり) | 200 |
プロジェクトあたりのサンプル クエリセット読み取りリクエスト数(1 分あたり) | 100 |
プロジェクトあたりのサンプル クエリセット書き込みリクエスト数(1 分あたり) | 100 |
プロジェクトあたりのサンプルクエリ書き込みリクエスト数(1 分あたり) | 200 |
プロジェクトあたりのスキーマ読み取りリクエスト数(1 分あたり) | 100 |
プロジェクトあたりのスキーマ書き込みリクエスト数(1 分あたり) | 100 |
1 分、1 プロジェクトあたりの検索リクエスト数 | 300 |
1 分、1 プロジェクトあたりのユーザー イベント バッチ リクエスト(インポートや削除など) | 100 |
1 分、1 プロジェクト、1 ユーザーあたりのユーザー イベント収集リクエスト数 | 240 |
1 分、1 プロジェクトあたりのユーザー イベントの書き込みリクエスト数 | 60,000 |
ウェブページのインデックス登録の割り当て
[ウェブサイトの高度なインデックス登録] がオンになっているデータストアがある場合、インデックスに登録するすべてのウェブページは、[割り当て] リストの [プロジェクトあたりのドキュメント数] の割り当てにカウントされます。プロジェクト内のページ数と、そのプロジェクトのページ割り当ては、データストアの [データ] ページの [プロジェクトのページ数と割り当て] フィールドで確認することもできます。
プロジェクトのデータストアにウェブサイトを追加し、そのウェブサイトのウェブページがプロジェクトの割り当てを超えると、ウェブサイトはインデックスに登録されません。データストアにすでにインデックス登録されているウェブサイトがある場合、それらのウェブサイトは引き続き以前と同じようにインデックス登録されます。割り当てのアップグレードはいつでもリクエストできます。
割り当ての増加をリクエストする
通常、割り当てを調整するには Google Cloud コンソールを使用します。詳細については、割り当ての調整をリクエストするをご覧ください。