這個頁面說明 Cloud Run 的使用配額和限制。
Cloud Run 的資源數量有限。Cloud Run 的配額中包含 API 頻率限制,這類限制會影響您可以呼叫 Cloud Run Admin API 的頻率。
下列項目未設有直接限制:
- 您可以部署的容器映像檔大小。
- Cloud Run 服務提供的並行要求數量。
Cloud Run 的資源上限
如要超出可增加的限制,請要求增加配額。如要超出無法提高的專案限制,請在其他 Google Cloud 專案或區域中建立新資源。
資源 | 範圍 | 說明 | 限制 | 是否可增加 |
---|---|---|---|---|
服務 | 每個專案和區域 | 服務數量上限 | 1000 | 否 |
工作 | 每個專案和區域 | 工作數量上限 | 1000 | 否 |
工作執行作業 | 每個專案和區域 | 執行中的工作執行作業數量上限 | 1000 | 否 |
修訂版本 | 每項服務 | 每項服務的修訂版本數量上限。達到上限時,系統會自動依據建立時間順序刪除未提供服務的修訂版本 | 1000 | 否 |
修訂版本 | 每個專案和區域 | 提供流量的修訂版本數量上限 | 4000 | 否 |
修訂版本標記 | 每個專案和區域 | 修訂版本標記數量上限。超過修訂版本標記限制時,Cloud Run 會對服務執行標記清理作業。對於要建立新標記的服務,系統會依據歷史記錄順序自動刪除未指定流量百分比的標記。 | 2000 | 否 |
工作執行作業 | 每個工作 | 已完成的工作執行作業的保留期限上限。當某項工作的執行次數達到上限時,系統會依據建立時間順序自動刪除執行作業 | 1,000 | 否 |
工作執行作業1 | 每個工作執行作業 | 同時執行的工作數量上限 | 取決於所選區域和 CPU 和 記憶體 設定。在容量較高的地區,這個上限可能會提高;在最近開放的地區,則可能會降低。您可以在「配額與系統限制」控制台頁面中查看配額。 | 是 |
工作執行作業 | 每個工作執行作業 | 工作逾時上限值 | 168 小時 (7 天)2 | 否 |
工作執行作業 | 每個工作執行作業 | 單一工作中的工作數量上限 | 10,000 | 否 |
工作執行作業 | 每個工作執行作業 | 工作中的工作重試次數上限 | 10 | 否 |
環境變數 | 每個工作或每項服務 | 每個容器的環境變數數量上限 | 1000 | 否 |
指令引數 | 每個工作或每項服務 | 每個容器的命令引數數量上限 | 1000 | 否 |
容器執行個體 1 | 每個修訂版本 | 容器執行個體數量上限 | 取決於所選區域、CPU 和記憶體設定。在容量較高的地區,這個上限可能會提高;在最近開放的地區,則可能會降低。您可以在「配額與系統限制」控制台頁面中查看配額。 | 是 |
容器執行個體 1 | 每個專案和區域 | 所有執行中的工作執行作業的容器執行個體數量上限 | 取決於所選區域,以及 CPU 和 記憶體 設定。在容量較高的地區,這個上限可能會提高;在最近開放的地區,則可能會降低。您可以在「配額與系統限制」控制台頁面中查看配額。 | 是 |
容器執行個體3 | 每個修訂版本和區域 | 使用直接虛擬私有雲來處理輸出流量的容器執行個體數量上限 | 100 到 200 個,具體取決於所選區域設定。 | 是 |
容器執行個體 | 每個容器執行個體 | 啟動逾時時間 (以分鐘為單位) | 4 | 否 |
記憶體 | 每個容器執行個體 | 記憶體大小上限 (GiB) | 32 | 否 |
CPU | 每個容器執行個體 | vCPU 數量上限 | 8 | 否 |
CPU1 | 每個專案和區域 | 在 1 分鐘內,所有執行個體分配的 CPU 總量 (以毫秒 vCPU 為單位)。 | 取決於所選區域。在容量較高的地區,這個限制可能會提高;在最近開放的地區,則可能會降低。 | 是 |
記憶體1 | 每個專案和區域 | 在 1 分鐘內,所有執行個體分配的總記憶體上限 (以位元組為單位)。 | 取決於所選區域。在容量較高的地區,這個上限可能會提高;在最近開放的地區,則可能會降低。您可以在「配額與系統限制」控制台頁面中查看配額。 | 是 |
沒有區域備援保證的 GPU 執行個體1、4 | 每個區域每項專案 | 容器執行個體 (含 GPU) 數量上限 | 04 | 是 |
提供可用區備援機制的 GPU 執行個體1、4 | 每個區域每項專案 | 容器執行個體 (含 GPU) 數量上限 | 04 | 是 |
磁碟 | 每個容器執行個體 | 受限於執行個體記憶體的可寫入記憶體內檔案系統容量上限 (GiB) | 32 | 否 |
環境變數 | 每個變數 | 變數長度上限 (Kb) | 32 | 否 |
網域對應 | 每個頂層網域每週 | 安全資料傳輸層 (SSL) 憑證數量上限 | 50 | 否 |
網域對應 | 每個頂層網域每週 | 重複安全資料傳輸層 (SSL) 憑證數量上限 | 5 | 否 |
存取權杖 | 每個容器執行個體每秒 | 產生的不重複存取權杖數量上限 | 50 | 否 |
識別權杖 | 每個容器執行個體每秒 | 產生的不重複識別權杖數量上限 | 50 | 否 |
已開啟的檔案 | 每個容器執行個體 | 可同時開啟的檔案數量上限。對應至 /proc/sys/fs/file-max 。 |
25000 | 否 |
1這些區域配額適用於以下幾種情況:
修訂版本的最大例項屬性可選取的最大值。一旦在特定區域中授予此權限,該區域中的所有修訂版本都可以達到授予的限制。
工作的最大平行處理數量。一旦在特定地區授予此權限,該地區的所有工作都會達到授予的限制。
在某個區域執行工作的執行作業的容器執行個體總數。
2 搶先體驗版支援超過 24 小時的逾時時間。
3這項地區配額適用於下列幾種情況:
這項屬性可控制使用直接虛擬私有雲端網路出口的修訂版本,可選取最大執行個體屬性的最大值。一旦在特定區域中授予此權限,該區域中的所有修訂版本都可以達到授予的限制。
這個屬性會控制使用直接虛擬私有雲輸出流量的工作的最大平行處理數量。一旦在特定地區授予此權限,該地區的所有工作都會達到授予的限制。
4 如要存取 GPU,您必須申請提高 NvidiaL4GpuAllocPerProjectRegion 或 NvidiaL4GpuAllocNoZonalRedundancyPerProjectRegion 配額。如果 GPU 使用率高峰未接近配額,Google 可能會調降您的配額。
Cloud Run 的網路限制
Cloud Run 的要求限制
說明 | 限制 | 附註 |
---|---|---|
每個執行個體的並行要求數量上限 | 1000 | |
每個 HTTP/2 用戶端連線的並行串流數量上限 | 100 | |
每項要求的逾時前等待時間上限 | 60 分鐘 | |
HTTP/1 要求大小上限 | 如果使用 HTTP/1 伺服器,則為 32 MiB。如果使用 HTTP/2 伺服器,則沒有限制。 | |
最大 HTTP/1 回應大小 | 如果未使用 Transfer-Encoding: chunked 或串流機制,則為 32 MiB |
|
每個執行個體每秒的傳出連線數 | 700 | 不適用於傳送至 VPC 網路的直接虛擬私有雲輸出流量,因為該流量不受限制。 |
每秒每個執行個體的出站 DNS 解析 | 1000 | |
每秒傳入到每個執行個體 HTTP/1 容器連接埠的傳入要求 | 800 | 不適用於 HTTP/2 容器通訊埠。 |
Cloud Run 的頻寬限制
下列頻寬限制適用於 Cloud Run 執行個體:
說明 | 限制 | 附註 |
---|---|---|
透過 Direct VPC 輸出時,每個執行個體的位元數上限 | 1 Gbps | 透過直接虛擬私有雲輸出流量,將流量傳送至虛擬私有雲網路上的目的地。 |
每個執行個體的位元數上限 (不含透過直接虛擬私有雲的輸出流量) | 600 Mbps | 根據入站和出站位元總和,不含透過直接虛擬私有雲 egress 傳送至虛擬私有雲網路上的目標位置。 |
每個執行個體的封包傳輸速率總和上限 (不含透過直接虛擬私有雲的 egress) | 每秒 64,000 個封包 | 根據入站封包和出站封包的總和,不含透過直接虛擬私有雲 egress 傳送至 VPC 網路目的地的出站流量。 |
如果達到這兩項限制中的任一項,Cloud Run 執行個體的頻寬就會受到限制。
Cloud Run Admin API 頻率限制
下列頻率限制適用於 Cloud Run Admin API,但不適用於傳送至已部署 Cloud Run 服務的要求。
配額 | 說明 | 限制 | 是否可增加 | 範圍 |
---|---|---|---|---|
Cloud Run Admin API 讀取要求 | 每個區域每 60 秒的「API」讀取作業數。這「不」是傳送至 Cloud Run 服務的讀取要求數 (無限制)。 | 每 60 秒 3,000 個 | 是 | 每個專案和區域 |
Cloud Run Admin API 寫入要求 | 每個區域每 60 秒的「API」寫入作業數。這「不」是傳送至 Cloud Run 服務的寫入要求數 (無限制)。 | 每 60 秒 180 個 | 是 | 每個專案和區域 |
工作執行作業 | 每個區域每 60 秒可執行的工作數量上限。 | 每 60 秒 180 個 | 是 | 每個專案和區域 |
如何提高配額
Cloud Quotas 的調整要求可能需要經過審查。如果配額調整要求需要審查,我們會發送電子郵件通知,確認已收到您的要求。如需進一步協助,請回覆該電子郵件。要求經審查後,我們會傳送電子郵件,通知您要求是否獲准。
控制台
如要調整配額值,請按照下列步驟操作:
在 Google Cloud 控制台,依序前往「IAM & Admin」(IAM 與管理) >「Quotas & System Limits」(配額與系統限制) 頁面:
在「Quota」(配額) 欄找出要調整的配額值,然後勾選該配額旁邊的核取方塊。
您可以視需要使用「Filter」(篩選條件) 搜尋框來尋找配額。
點選
「Edit」(編輯),「Quota changes」(配額變更) 對話方塊會隨即顯示。在「New value」(新值) 欄位輸入所需的配額值。部分配額值須設定計量單位;在這種情況下,請在相鄰清單中選取所需單位。接著,點選「Done」(完成)。
選用步驟:如果核取方塊顯示「
I understand that this request will remove any overrides
」,表示將配額值調整為等於或大於預設值的數字,先前的配額覆寫設定就會移除。同意的話,請勾選核取方塊並繼續操作。如要將配額值提高到超出對話方塊中顯示的數字,請選取「Apply for higher quota」(申請更多配額)。
在「Quota changes」(配額變更) 表單的「New value」(新值) 欄位,輸入所需的新配額值。如果出現「Request description」(要求說明) 欄位,請輸入說明。接著,點選「Done」(完成)。
如果出現「Next」(下一步) 按鈕,請點選「Next」(下一步),並在隨後的畫面中填寫聯絡資料。
點選「Submit request」(提交要求)。
如果發現無法透過控制台提出調整要求,請向 Cloud Customer Care 申請提高配額。
如要進一步瞭解配額提高程序的運作方式,請參閱「關於配額調整」的相關說明。
批次傳送要求以提高配額值
您可以選取每個要納入的配額旁邊的核取方塊,以便批次傳送提高配額的要求。不過,批次傳送要求可能會增加 Google Cloud 審查要求所需的時間。
為縮短審查時間,請依產品和區域將配額調整要求分組。舉例來說,如果您想申請調整網路和 Compute Engine VM 配額,請分別建立網路配額和 Compute Engine VM 配額的要求。