Cloud Run の割り当てと上限

このページでは、Cloud Run の使用時に適用される使用量割り当てと上限について説明します。

Cloud Run のリソース数には上限が適用されます。Cloud Run の割り当ては、Cloud Run Admin API の呼び出しレートに影響を与える API のレート上限を包含します。

以下のものに対する直接的な上限はありません。

  • デプロイできるコンテナ イメージのサイズ
  • Cloud Run サービスによって処理される同時リクエストの数

Cloud Run のリソースの上限

増加可能な上限を引き上げるには、割り当ての増加をリクエストします。プロジェクトごとの上限を引き上げることができない場合は、別の Google Cloud プロジェクトまたはリージョンに新しいリソースを作成します。

リソース 範囲 説明 上限 上限引き上げ可能
サービス プロジェクトとリージョンごと サービスの最大数 1,000 ×
ジョブ プロジェクトとリージョンごと ジョブの最大数 1,000 ×
ジョブの実行 プロジェクトとリージョンごと 実行中のジョブの最大数 1000 ×
リビジョン サービスごと サービスごとのリビジョンの最大数。上限に達すると、サービスを提供していないリビジョンが、古い順に自動的に削除されます。 1,000 ×
リビジョン プロジェクトとリージョンごと トラフィックを処理するリビジョンの最大数 4000 ×
リビジョン タグ プロジェクトとリージョンごと リビジョンタグの最大数リビジョンタグの上限を超えると、Cloud Run はサービスでタグのクリーンアップを実行します。新しいタグが作成されるサービスの場合、トラフィックの割合が指定されていないタグは、古いものから順に自動的に削除されます。 2000 ×
ジョブの実行 ジョブごと 完了したジョブの実行の保持の上限。完了したジョブの実行数がこの上限に達すると、実行は古いものから自動的に削除されます。 1,000 ×
ジョブ実行タスク1 ジョブ実行ごと 並列で実行されるタスクの最大数 選択したリージョン、CPUメモリ構成によって異なります。この上限は、大容量リージョンでは高く、最近開いたリージョンでは低くなる可能性があります。割り当ては、コンソールの [割り当てとシステム上限] ページで確認できます。
ジョブ実行タスク ジョブ実行ごと タスクの最大タイムアウト値 168 時間( 7 日) 2 ×
ジョブ実行タスク ジョブ実行ごと 1 つのジョブの最大タスク数 10,000 ×
ジョブ実行タスク ジョブ実行ごと ジョブのタスク再試行の最大数 10 ×
環境変数 ジョブごとまたはサービスごと 各コンテナの環境変数の最大数 1000 ×
コマンドの引数 ジョブごとまたはサービスごと 各コンテナのコマンド引数の最大数 1000 ×
コンテナ インスタンス1 リビジョンごと コンテナ インスタンスの最大数 選択したリージョン、CPU、メモリ構成によって異なります。この上限は、大容量リージョンでは高く、最近開設されたリージョンでは低くなる可能性があります。デフォルトでは、Cloud Run リビジョンは最大 100 個のインスタンスにスケールアップするように構成されています。割り当ては、コンソールの [割り当てとシステム上限] ページで確認できます。
コンテナ インスタンス1 プロジェクトとリージョンごと 実行中のすべてのジョブ実行のコンテナ インスタンスの最大数 選択したリージョン、CPUメモリ構成によって異なります。この上限は、大容量リージョンでは高く、最近開いたリージョンでは低くなる可能性があります。割り当ては、コンソールの [割り当てとシステム上限] ページで確認できます。
コンテナ インスタンス3 リビジョンとリージョンごと ダイレクト VPC 下り(外向き)を使用するコンテナ インスタンスの最大数 100~200。選択したリージョン構成によって異なります。
コンテナ インスタンス コンテナ インスタンスごと 起動タイムアウト(分) 4 ×
メモリ コンテナ インスタンスごと 最大メモリサイズ(GiB) 32 ×
CPU コンテナ インスタンスごと vCPU の最大数 8 ×
CPU1 プロジェクトとリージョンごと 1 分間にすべてのインスタンスに割り当てられる CPU の合計の上限(ミリ vCPU)。 選択したリージョンによって異なります。この上限は、大容量リージョンでは高く、最近開いたリージョンでは低くなる可能性があります。
メモリ1 プロジェクトとリージョンごと 1 分間にすべてのインスタンスに割り当てられるメモリの合計の上限(バイト単位)。 選択したリージョンによって異なります。この上限は、大容量リージョンでは高く、最近開いたリージョンでは低くなる可能性があります。割り当ては、コンソールの [割り当てとシステム上限] ページで確認できます。
ゾーン冗長性の保証のない GPU インスタンス1,4 プロジェクトごと、リージョンあたり GPU を使用するコンテナ インスタンスの最大数 04
ゾーン冗長性保証付きの GPU インスタンス1,4 プロジェクトごと、リージョンあたり GPU を使用するコンテナ インスタンスの最大数 04
ディスク コンテナ インスタンスごと 書き込み可能なメモリ内ファイル システムの最大サイズ(GiB)。インスタンスのメモリによって制限されます。 32 ×
環境変数 変数ごと 変数の最大長(KB) 32 ×
ドメイン マッピング トップドメインおよび週ごと SSL 証明書の最大数 50 ×
ドメイン マッピング トップドメインおよび週ごと 重複する SSL 証明書の最大数 5 ×
アクセス トークン コンテナ インスタンスごと、1 秒あたり 生成される一意のアクセス トークンの最大数 50 ×
ID トークン コンテナ インスタンスごと、1 秒あたり 生成される一意の ID トークンの最大数 50 ×
ファイルのオープン コンテナ インスタンスごと 同時に開くことができるファイルの最大数。
/proc/sys/fs/file-max に対応しています。
25000 ×

1 これらのリージョンの割り当ては、それぞれが以下を制御する複数のケースで使用されます。

  1. リビジョンの最大インスタンス属性に選択可能な最大値。特定のリージョンで付与されると、そのリージョン内のすべてのリビジョンが上限まで引き上げられます。

  2. ジョブの最大並列処理数。特定のリージョンで付与されると、そのリージョン内のすべてのジョブが上限まで引き上げられます。

  3. 1 つのリージョン内でジョブ実行に使用されるコンテナ インスタンスの総数です。

2 24 時間を超えるタイムアウトのサポートは、プレビュー版で利用できます。

3 このリージョンの割り当ては、いくつかのケースで使用されます。

  1. ダイレクト VPC 下り(外向き)を使用して、リビジョンの最大インスタンス属性に選択可能な最大値を制御します。特定のリージョンで付与されると、そのリージョン内のすべてのリビジョンが上限まで引き上げられます。

  2. ダイレクト VPC 下り(外向き)を使用してジョブの最大並列処理を制御します。特定のリージョンで付与されると、そのリージョン内のすべてのジョブが上限まで引き上げられます。

4 GPU にアクセスするには、NvidiaL4GpuAllocPerProjectRegion または NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion の割り当ての増加をリクエストする必要があります。ピーク時の GPU 使用量が割り当てに近付かない場合は、割り当てが減らされる可能性があります。

Cloud Run のネットワークの上限

Cloud Run のリクエストの上限

説明 上限 備考
インスタンスあたりの同時リクエストの最大数 1000
HTTP/2 クライアント接続あたりの同時ストリームの最大数 100
リクエストごとのタイムアウトまでの最大時間 60 分
HTTP/1 リクエストの最大サイズ HTTP/1 サーバーを使用する場合は 32 MiB。HTTP/2 サーバーを使用する場合は無制限。
HTTP/1 レスポンスの最大サイズ Transfer-Encoding: chunked またはストリーミング メカニズムを使用しない場合は 32 MiB
インスタンスごとの 1 秒あたりのアウトバウンド接続 700 VPC ネットワークに送信されるダイレクト VPC 下り(外向き)トラフィックに適用されません。このトラフィックは制限されません。
インスタンスごとの 1 秒あたりのアウトバウンド DNS 解決数 1000
インスタンスごとの HTTP/1 コンテナポートへの 1 秒あたりのインバウンド リクエスト数 800 HTTP/2 コンテナポートには適用されません。

Cloud Run の帯域幅の上限

Cloud Run インスタンスには、次の帯域幅の上限が適用されます。

説明 上限
ダイレクト VPC 経由の下り(外向き)のインスタンスあたりの最大ビット数 1 Gbps VPC ネットワーク上の宛先へのダイレクト VPC 下り(外向き)経由の下り(外向き)。
インスタンスあたりの最大ビット数(ダイレクト VPC 経由の下り(外向き)を除く) 600 Mbps 上り(内向き)パケットと下り(外向き)の合計ビット数に基づきます。VPC ネットワーク上の宛先へのダイレクト VPC 下り(外向き)経由の下り(外向き)は除きます。
インスタンスあたりの最大合計パケットレート(ダイレクト VPC 経由の下り(外向き)を除く) 1 秒あたり 64,000 パケット 上り(内向き)パケットと下り(外向き)パケットの合計に基づきます。VPC ネットワーク上の宛先へのダイレクト VPC 下り(外向き)経由の下り(外向き)は除きます。

この 2 つの上限のいずれかに達すると、Cloud Run インスタンスの帯域幅が制限されます。

Cloud Run Admin API のレート上限

Cloud Run Admin API には次のレート上限が適用されます。この上限は、デプロイされた Cloud Run サービスに到達するリクエストには適用されません。

割り当て 説明 上限 上限引き上げ可否 スコープ
Cloud Run Admin API 読み取りリクエスト リージョンごとの 60 秒あたりの API 読み取り数。これは、Cloud Run サービスに対する読み取りリクエスト数ではありません。このリクエスト数に上限はありません。 60 秒あたり 3,000 個 プロジェクトとリージョンごと
Cloud Run Admin API 書き込みリクエスト リージョンごとの 60 秒あたりの API 書き込み数。これは、Cloud Run サービスに対する書き込みリクエスト数ではありません。このリクエスト数に上限はありません。 60 秒あたり 180 個 プロジェクトとリージョンごと
ジョブ実行 各リージョンで 60 秒あたりにジョブを実行できる最大回数。 60 秒あたり 180 個 プロジェクトとリージョンごと

割り当てを増やす方法

Cloud Quotas の調整リクエストは審査の対象となります。割り当て調整リクエストの審査が必要な場合は、リクエストの受領確認メールが届きます。ご不明な点がある場合は、そのメールに返信してください。リクエストが審査されると、リクエストが承認されたかどうかを通知するメールが届きます。

コンソール

割り当て値を調整する手順は次のとおりです。

  1. Google Cloud コンソールで、[IAM と管理] > [割り当てとシステム上限] ページに移動します。

    [割り当てとシステム上限] に移動

  2. [割り当て] 列で、更新する割り当て値を見つけ、更新する割り当ての横にあるチェックボックスをオンにします。

    必要に応じて、[フィルタ] 検索ボックスを使用して割り当てを検索します。

  3. [編集] をクリックすると、[割り当ての変更] ダイアログが表示されます。

  4. [新しい値] フィールドに、必要な割り当て値を入力します。割り当て値には測定単位が設定されている場合があります。この場合は、隣接するリストから必要な単位を選択します。[完了] をクリックします。

    省略可: I understand that this request will remove any overrides というテキストが配置されたチェックボックスが表示されている場合は、割り当て値をデフォルト値以上になるように調整すると、以前の割り当てのオーバーライドが削除されます。これが目的の設定である場合は、チェックボックスをオンにして続行します。

  5. ダイアログに表示されている数値を超える割り当て値に引き上げるには、[割り当ての増加を申し込む] を選択します。

    1. [割り当ての変更] フォームの [新しい値] フィールドに、必要とする更新済みの割り当て値を入力します。[リクエストの説明] フィールドが表示されている場合は、説明を入力します。[完了] をクリックします。

    2. [次へ] ボタンが表示されたら、[次へ] をクリックし、次の画面で連絡先情報を入力します。

  6. [リクエストを送信] をクリックします。

コンソールから調整をリクエストできない場合は、Cloud カスタマーケアに引き上げをリクエストしてください。

割り当ての増加プロセスの仕組みについては、割り当ての調整についてをご覧ください。

割り当て値を引き上げる複数のリクエストをまとめる

割り当ての引き上げをまとめてリクエストするには、追加する個々の割り当ての横にあるチェックボックスをオンにします。ただし、一括処理リクエストにより、 Google Cloud によるリクエストの審査に時間がかかることがあります。

審査時間を短縮するには、割り当て調整リクエストをプロダクトとエリア別にグループ化します。たとえば、ネットワーキングと Compute Engine VM の割り当ての調整をリクエストする場合は、ネットワーキングの割り当てリクエストと Compute Engine VM の割り当てリクエストをそれぞれ作成します。