このドキュメントでは、Document AI に適用される割り当てと上限について説明します。
- 割り当ては、使用できるカウント可能な共有リソースの量を指定します。割り当ては、Document AI などの Google Cloud サービスによって定義されます。
- システムの上限は固定値で、変更できません。
Google Cloud では、割り当てを使用して公平性を確保し、リソースの使用量と可用性の急増を抑えます。割り当ては、 Google Cloud プロジェクトで使用できるGoogle Cloud リソースの量を制限します。割り当ては、ハードウェア、ソフトウェア、ネットワーク コンポーネントなど、さまざまなリソースタイプに適用されます。たとえば、割り当てによって、サービスへの API 呼び出しの数、プロジェクトで同時に使用されるロードバランサの数、作成可能なプロジェクトの数を制限できます。割り当てを適用することで、サービスの過負荷を防ぎ、Google Cloud ユーザーのコミュニティを保護します。割り当ては、自組織で使用している Google Cloud リソースの管理にも役立ちます。
Cloud Quotas システムは次のことを行います。
- Google Cloud のプロダクトとサービスの消費量をモニタリングする
- これらのリソースの消費量を制限する
- 割り当て値の変更をリクエストし、割り当ての調整を自動化する手段を提供する
ほとんどの場合、割り当ての許容量を超えるリソースを消費しようとすると、システムによってリソースへのアクセスがブロックされ、実行しようとしているタスクは失敗します。
割り当ては通常、 Google Cloud プロジェクト レベルで適用されます。あるプロジェクトでリソースを使用しても、別のプロジェクトで使用可能な割り当てに影響することはありません。 Google Cloud プロジェクト内では、すべてのアプリケーションと IP アドレスで割り当てが共有されます。
このドキュメントでは、Document AI に適用される割り当ての一覧を示します。
サービス階層
Document AI は、生成 AI を搭載したプロセッサ バージョンに対するオンライン プロセス リクエスト用に、プロビジョニング済みとベスト エフォートの 2 つのサービスティアと関連する割り当てをサポートしています。
プロビジョニングされた階層の割り当てでは、カスタム エクストラクタ v1.4 や v1.5 などのベース プロセッサ バージョンで 1 分あたり 120 ページ、カスタム エクストラクタ v1.5 Pro などのベース プロセッサ バージョンで 1 分あたり 30 ページが提供されます。
ベスト エフォート階層の割り当てでは、カスタム エクストラクタ v1.4 や v1.5 などのベース プロセッサ バージョンに 120、カスタム エクストラクタ v1.5 Pro などの Pro プロセッサ バージョンに 60 が提供されます。この割り当ては、プロビジョニングされた割り当てが使い果たされた場合にのみ使用されます。これは、コンソールの割り当て BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS
(指標 best_effort_online_process_document_pages_us
)と BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU
(指標 best_effort_online_process_document_pages_eu
)に適用されます。
メモ | カスタム エクストラクタ v1.4(Gemini 2.0 Flash ベース) | カスタム エクストラクタ v1.5(Gemini 2.5 Flash ベース) | カスタム抽出ツール v1.5 Pro(Gemini 2.5 Pro ベース) |
---|---|---|---|
プロビジョニング済み | 120 | 120 | 30 |
ベスト エフォート | 120 | 120 | 60 |
組織レベルでプロビジョニング済み | 240 | 240 | 60 |
ベスト エフォートの割り当てに記載されている値を超える割り当てが必要な場合は、営業チームの担当者に連絡して、割り当て増加リクエスト(QIR)を行うことができます。
ベスト エフォート ティアにはサービスレベル契約はありません。
割り当てリスト
次の割り当てが Document AI に適用されます。これらの割り当ては、各 Google Cloud コンソール プロジェクトに適用され、そのプロジェクトを使用するすべてのアプリケーションと IP アドレスで共有されます。
処理するリクエスト数を増やしたい場合は、Google Cloud コンソールでプロジェクトの Document AI 割り当てリクエストを送信してください。
リクエストには、具体的なニーズとユースケースに関する情報を入力してください。
リクエストの割り当て | デフォルト値 | メモ |
---|---|---|
1 分あたりのリクエスト数 | 1 ユーザーあたり 1,800 件 | Google Cloud コンソールで割り当てを表示する |
1 分あたりのオンライン プロセス リクエスト数(v1beta2 のみ) | 1 プロジェクトあたり 600 件 | Google Cloud コンソールで割り当てを表示する |
1 分あたりのオンライン プロセス リクエスト数(米国) | プロセッサ タイプごとに 1 プロジェクトあたり 120 | Google Cloud コンソールで割り当てを表示する |
1 分あたりのオンライン プロセス リクエスト数(EU) | プロセッサ タイプごとに 1 プロジェクトあたり 120 | Google Cloud コンソールで割り当てを表示する |
1 分あたりのオンライン プロセス ドキュメント ページ数(米国)、プロセッサ タイプとモデル バージョン別(Gemini 2.0 Flash を使用した Custom Extractor v1.4 のみ) | 1 分あたり 120 ページ* | Google Cloud コンソールで割り当てを表示する |
1 分あたりのオンライン処理ドキュメント ページ数(EU)(プロセッサ タイプとモデル バージョンごと)(Gemini 2.0 Flash を使用した Custom Extractor v1.4 のみ) | 1 分あたり 120 ページ* | Google Cloud コンソールで割り当てを表示する |
プロセッサ タイプとモデル バージョンごとの 1 分あたりのオンライン処理ドキュメント ページ数(米国)(Gemini 2.5 Flash を使用した Custom Extractor v1.5 のみ) | 1 分あたり 120 ページ* | Google Cloud コンソールで割り当てを表示する |
プロセッサ タイプとモデル バージョンごとの 1 分あたりのオンライン処理ドキュメント ページ数(EU)(Gemini 2.5 Flash を使用した Custom Extractor v1.5 のみ) | 1 分あたり 120 ページ* | Google Cloud コンソールで割り当てを表示する |
1 分あたりのオンライン プロセス リクエスト数(単一リージョン) | プロセッサ タイプごとにプロジェクトあたり 6 個 | Google Cloud コンソールで割り当てを表示する |
プロジェクトとリージョンごとの同時実行バッチプロセス リクエスト数(米国) | 1 プロジェクトあたり 5 件 | Google Cloud コンソールで割り当てを表示する |
プロジェクトとリージョンごとの同時実行バッチプロセス リクエスト数(EU) | 1 プロジェクトあたり 5 件 | Google Cloud コンソールで割り当てを表示する |
プロセッサあたりの同時実行バッチ処理リクエスト数(単一リージョン) | 1 プロジェクトあたり 5 件 | Google Cloud コンソールで割り当てを表示する |
アクティブに処理中のページ数(v1beta2 のみ) | 1 プロジェクトあたり 10,000 | Google Cloud コンソールで割り当てを表示する |
同時実行可能なプロセッサ バージョンのトレーニング リクエスト(米国) | 1 プロジェクトあたり 1 個 | Google Cloud コンソールで割り当てを表示する |
同時実行可能なプロセッサ バージョンのトレーニング リクエスト(EU) | 1 プロジェクトあたり 1 個 | Google Cloud コンソールで割り当てを表示する |
同時実行可能なプロセッサ バージョンのトレーニング リクエスト数(単一リージョン) | プロジェクトあたり 1 個† | Google Cloud コンソールで割り当てを表示する |
デプロイされたカスタム プロセッサ バージョン(米国) | 1 プロジェクトあたり 5 件 | Google Cloud コンソールで割り当てを表示する |
デプロイされたカスタム プロセッサ バージョン(EU) | 1 プロジェクトあたり 5 件 | Google Cloud コンソールで割り当てを表示する |
デプロイされたカスタム プロセッサ バージョン(単一リージョン) | 1 プロジェクトあたり 5 件 | Google Cloud コンソールで割り当てを表示する |
デプロイされた生成プロセッサ バージョン(米国) | プロジェクトあたり、カスタム抽出プロセッサあたり 100 | Google Cloud コンソールで割り当てを表示する |
デプロイされた生成プロセッサ バージョン(EU) | プロジェクトあたり、カスタム抽出プロセッサあたり 100 | Google Cloud コンソールで割り当てを表示する |
デプロイされた生成プロセッサ バージョン(単一リージョン) | プロジェクトあたり、カスタム抽出プロセッサあたり 100 | Google Cloud コンソールで割り当てを表示する |
同時実行可能なドキュメントのインポート リクエスト(米国) | 1 プロジェクトあたり 3 個 | Google Cloud コンソールで割り当てを表示する |
同時実行可能なドキュメントのインポート リクエスト(EU) | 1 プロジェクトあたり 3 個 | Google Cloud コンソールで割り当てを表示する |
同時実行可能なドキュメントのインポート リクエスト(単一リージョン) | 1 プロジェクトあたり 3 個 | Google Cloud コンソールで割り当てを表示する |
同時実行可能な輸出書類リクエスト(米国) | 1 プロジェクトあたり 1 個 | Google Cloud コンソールで割り当てを表示する |
同時実行可能な輸出書類リクエスト(EU) | 1 プロジェクトあたり 1 個 | Google Cloud コンソールで割り当てを表示する |
同時実行可能なエクスポート ドキュメント リクエスト(単一リージョン) | 1 プロジェクトあたり 1 個 | Google Cloud コンソールで割り当てを表示する |
* このバージョンでは、割り当て調整リクエストはまだサポートされていません。
† 割り当ての調整リクエストにより、australia-southeast1
でサポートされます。