Cloud Run の割り当てと上限

このページでは、Cloud Run の使用時に適用される使用量割り当てと上限について説明します。

Cloud Run のリソース数には上限が適用されます。Cloud Run の割り当ては、Cloud Run Admin API の呼び出しレートに影響を与える API のレート上限を包含します。

以下のものに対する直接的な上限はありません。

  • デプロイできるコンテナ イメージのサイズ
  • Cloud Run サービスによって処理される同時リクエストの数

Cloud Run のリソースの上限

増加可能な上限を引き上げるには、割り当ての増加をリクエストします。プロジェクトごとの上限を引き上げることができない場合は、別の Google Cloud プロジェクトまたはリージョンに新しいリソースを作成します。

リソース 範囲 説明 上限 上限引き上げ可能
サービス プロジェクトとリージョンごと サービスの最大数 1,000 ×
ジョブ プロジェクトとリージョンごと ジョブの最大数 1,000 ×
ジョブの実行 プロジェクトとリージョンごと 実行中のジョブの最大数 1000 ×
リビジョン サービスごと サービスごとのリビジョンの最大数。上限に達すると、サービスを提供していないリビジョンが、古い順に自動的に削除されます。 1,000 ×
リビジョン プロジェクトとリージョンごと トラフィックを処理するリビジョンの最大数 4000 ×
リビジョン タグ プロジェクトとリージョンごと リビジョンタグの最大数。リビジョン タグの上限を超えると、Cloud Run はサービスでタグのクリーンアップを実行します。新しいタグが作成されるサービスの場合、トラフィックの割合が指定されていないタグは、古いものから順に自動的に削除されます。 2000 ×
ジョブの実行 ジョブごと 完了したジョブの実行の保持の上限。完了したジョブの実行数がこの上限に達すると、実行は古いものから自動的に削除されます。 1,000 ×
ジョブ実行タスク1 ジョブ実行ごと 並列で実行されるタスクの最大数 選択したリージョン、CPUメモリ構成によって異なります。この上限は、大容量リージョンでは高く、最近開いたリージョンでは低くなる可能性があります。
ジョブ実行タスク ジョブ実行ごと タスクの最大タイムアウト値 168 時間(7 日)2 ×
ジョブ実行タスク ジョブ実行ごと 1 つのジョブの最大タスク数 10,000 ×
ジョブ実行タスク ジョブ実行ごと ジョブのタスク再試行の最大数 10 ×
環境変数 ジョブ単位またはサービス単位 各コンテナの環境変数の最大数 1000 ×
コマンドの引数 ジョブ単位またはサービス単位 各コンテナのコマンド引数の最大数 1000 ×
コンテナ インスタンス1 リビジョンごと コンテナ インスタンスの最大数 選択したリージョン、CPU、メモリ構成によって異なります。この上限は、大容量リージョンでは高く、最近開いたリージョンでは低くなる可能性があります。
コンテナ インスタンス1 プロジェクトとリージョンごと 実行中のすべてのジョブ実行のコンテナ インスタンスの最大数 選択したリージョン、CPUメモリ構成によって異なります。この上限は、大容量リージョンでは高く、最近開いたリージョンでは低くなる可能性があります。
コンテナ インスタンス3 リビジョンとリージョンごと ダイレクト VPC 下り(外向き)を使用するコンテナ インスタンスの最大数 100~200。選択したリージョン構成によって異なります。
コンテナ インスタンス コンテナ インスタンスごと 起動タイムアウト(分) 4 ×
メモリ コンテナ インスタンスごと 最大メモリサイズ(GiB) 32 ×
CPU コンテナ インスタンスごと vCPU の最大数 8 ×
CPU プロジェクトとリージョンごと 1 分間にすべてのインスタンスに割り当てられる CPU の合計の上限(ミリ vCPU)。 選択したリージョンによって異なります。この上限は、大容量リージョンでは高く、最近開いたリージョンでは低くなる可能性があります。
メモリ プロジェクトとリージョンごと 1 分間にすべてのインスタンスに割り当てられるメモリの合計の上限(バイト単位)。 選択したリージョンによって異なります。この上限は、大容量リージョンでは高く、最近開いたリージョンでは低くなる可能性があります。
GPU インスタンス4 プロジェクトごと、リージョンあたり GPU を使用するコンテナ インスタンスの最大数 04
ディスク コンテナ インスタンスごと 書き込み可能なメモリ内ファイル システムの最大サイズ(GiB)。インスタンスのメモリによって制限されます。 32 ×
環境変数 変数ごと 変数の最大長(KB) 32 ×
ドメイン マッピング トップドメインおよび週ごと SSL 証明書の最大数 50 ×
ドメイン マッピング トップドメインおよび週ごと 重複する SSL 証明書の最大数 5 ×
アクセス トークン コンテナ インスタンスごと、1 秒あたり 生成される一意のアクセス トークンの最大数 50 ×
ID トークン コンテナ インスタンスごと、1 秒あたり 生成される一意の ID トークンの最大数 50 ×
ファイルのオープン コンテナ インスタンスごと 同時に開くことができるファイルの最大数。
/proc/sys/fs/file-max に対応しています。
25000 ×

1 このリージョンの割り当ては、いくつかのケースで使用されます。

  1. リビジョンの最大インスタンス属性に選択可能な最大値を制御します。特定のリージョンで付与されると、そのリージョン内のすべてのリビジョンが上限まで引き上げられます。

  2. ジョブの最大並列処理を制御します。特定のリージョンで付与されると、そのリージョン内のすべてのジョブが上限まで引き上げられます。

  3. 1 つのリージョン内でジョブ実行を実行するためのコンテナ インスタンスの総数を制御します。

224 時間を超えるタイムアウトのサポートは、プレビュー版で利用できます。

3 このリージョンの割り当ては、いくつかのケースで使用されます。

  1. ダイレクト VPC 下り(外向き)を使用して、リビジョンの最大インスタンス属性に選択可能な最大値を制御します。特定のリージョンで付与されると、そのリージョン内のすべてのリビジョンが上限まで引き上げられます。

  2. ダイレクト VPC 下り(外向き)を使用してジョブの最大並列処理を制御します。特定のリージョンで付与されると、そのリージョン内のすべてのジョブが上限まで引き上げられます。

4 GPU にアクセスするには、Total Nvidia L4 GPU allocation, per project per region割り当ての増加をリクエストする必要があります。

Cloud Run のネットワークの上限

Cloud Run のリクエストの上限

説明 上限 備考
インスタンスあたりの同時リクエストの最大数 1000
HTTP/2 クライアント接続あたりの同時ストリームの最大数 100
リクエストごとのタイムアウトまでの最大時間 60 分
HTTP/1 リクエストの最大サイズ HTTP/1 サーバーを使用する場合は 32 MiB。HTTP/2 サーバーを使用する場合は無制限。
HTTP/1 レスポンスの最大サイズ Transfer-Encoding: chunked またはストリーミング メカニズムを使用しない場合は 32 MiB
インスタンスごとの 1 秒あたりのアウトバウンド接続 700
インスタンスごとの 1 秒あたりのアウトバウンド DNS 解決数 1000
インスタンスごとの HTTP/1 コンテナポートへの 1 秒あたりのインバウンド リクエスト数 800 HTTP/2 コンテナポートには適用されません。

Cloud Run の帯域幅の上限

Cloud Run インスタンスには、次の帯域幅の上限が適用されます。

説明 上限
ダイレクト VPC 経由の下り(外向き)のインスタンスあたりの最大ビット数 1 Gbps VPC ネットワーク上の宛先へのダイレクト VPC 下り(外向き)経由の下り(外向き)。
インスタンスあたりの最大ビット数(ダイレクト VPC 経由の下り(外向き)を除く) 600 Mbps 上り(内向き)パケットと下り(外向き)の合計ビット数に基づきます。VPC ネットワーク上の宛先へのダイレクト VPC 下り(外向き)経由の下り(外向き)は除きます。
インスタンスあたりの最大合計パケットレート(ダイレクト VPC 経由の下り(外向き)を除く) 1 秒あたり 64,000 パケット 上り(内向き)パケットと下り(外向き)パケットの合計に基づきます。VPC ネットワーク上の宛先へのダイレクト VPC 下り(外向き)経由の下り(外向き)は除きます。

この 2 つの上限のいずれかに達すると、Cloud Run インスタンスの帯域幅が制限されます。

Cloud Run Admin API のレート上限

Cloud Run Admin API には次のレート上限が適用されます。この上限は、デプロイされた Cloud Run サービスに到達するリクエストには適用されません。

割り当て 説明 上限 上限引き上げ可否 スコープ
Cloud Run Admin API 読み取りリクエスト リージョンごとの 60 秒あたりの API 読み取り数。これは、Cloud Run サービスに対する読み取りリクエスト数ではありません。このリクエスト数に上限はありません。 60 秒あたり 3,000 個 プロジェクトとリージョンごと
Cloud Run Admin API 書き込みリクエスト リージョンごとの 60 秒あたりの API 書き込み数。これは、Cloud Run サービスに対する書き込みリクエスト数ではありません。このリクエスト数に上限はありません。 60 秒あたり 180 個 プロジェクトとリージョンごと
ジョブ実行 各リージョンで 60 秒あたりにジョブを実行できる最大回数。 60 秒あたり 180 個 プロジェクトとリージョンごと

割り当てを増やす方法

割り当て値の引き上げをリクエストする手順は次のとおりです。

  1. [割り当てとシステム上限] ページに移動します。

    [割り当てとシステム上限] に移動

  2. [割り当て] 列で、引き上げる対象の割り当てを見つけます。[フィルタ] 検索ボックスを使用して割り当て量を検索できます。

  3. 引き上げる割り当ての横にあるチェックボックスをオンにします。

  4. [編集] をクリックします。[割り当ての変更] ダイアログが表示されます。

  5. 省略可: 画面に表示されている数値を超える割り当て値に引き上げる場合は、[割り当ての増加を申し込む] を選択します。フォームに記入し、送信して、残りの手順はスキップします。

  6. [割り当ての変更] フォームの [新しい値] フィールドに、希望する割り当てを入力します。[リクエストの説明] フィールドが表示されている場合は、説明を入力します。[完了] をクリックします。

    [このリクエストでオーバーライドが削除されることを理解しました] というメッセージが表示されたボックスが表示されている場合は、割り当て値がデフォルト値より低く設定されています。割り当て値をデフォルト値以上に調整すると、オーバーライドが削除されます。続行するには、チェックボックスをオンにします。詳細については、割り当てのオーバーライドをご覧ください。

    [次へ] ボタンが表示されたら、[次へ] をクリックし、次の画面で連絡先情報を入力します。

  7. [リクエストを送信] をクリックします。

コンソールから調整をリクエストできない場合は、Cloud カスタマーケアに引き上げをリクエストしてください。

Cloud Quotas の調整リクエストは審査の対象となります。割り当て調整リクエストの審査が必要な場合は、リクエストの受領確認メールが届きます。ご不明な点がある場合は、そのメールに返信してください。リクエストが審査されると、リクエストが承認されたかどうかを通知するメールが届きます。

割り当ての増加のプロセスの詳細については、割り当ての増加リクエストについてをご覧ください。

割り当て値を引き上げる複数のリクエストをまとめる

割り当ての引き上げをまとめてリクエストするには、追加するそれぞれの割り当ての横にあるチェックボックスをオンにします。リクエストをまとめてリクエストすると、Google Cloud によるリクエストの審査に時間がかかることがあります。審査時間を短縮するには、割り当て調整リクエストをプロダクトとエリア別にグループ化します。たとえば、ネットワーキングと Compute Engine VM の割り当ての調整をリクエストする場合は、ネットワーキングの割り当てリクエストと Compute Engine VM の割り当てリクエストをそれぞれ作成します。