Cloud Run 서비스의 경우 요청 제한 시간 설정은 Cloud Run에 배포된 서비스에서 응답을 반환해야 하는 시간을 지정합니다. 지정된 시간 내에 응답이 반환되지 않으면 요청이 종료되고 오류 504가 반환됩니다. 요청을 처리한 컨테이너 인스턴스는 종료되지 않습니다.
제한 시간
제한 시간은 기본적으로 5분(300초)으로 설정되며 최대 60분(3,600초)까지 연장할 수 있습니다.
컨테이너 이미지를 배포할 때 또는 서비스 구성을 업데이트하여 이 설정을 변경할 수 있습니다.
Cloud Run 요청 시간 제한을 변경하는 것 외에도 언어 프레임워크를 확인하여 업데이트가 필요한 자체 요청 시간 제한 설정이 있는지 확인해야 합니다. Cloud Run 서비스의 일부 클라이언트는 더 제한적인 시간 제한을 적용할 수 있습니다
필요한 역할
Cloud Run 서비스를 구성하고 배포하는 데 필요한 권한을 얻으려면 관리자에게 다음 IAM 역할을 부여해 달라고 요청하세요.
-
Cloud Run 서비스에 대한 Cloud Run 개발자(
roles/run.developer
) 역할 -
서비스 ID에 대한 서비스 계정 사용자(
roles/iam.serviceAccountUser
) 역할
Cloud Run과 연결된 IAM 역할 및 권한 목록은 Cloud Run IAM 역할 및 Cloud Run IAM 권한을 참조하세요. Cloud Run 서비스가 Cloud 클라이언트 라이브러리와 같은 Google Cloud API와 상호작용하는 경우에는 서비스 ID 구성 가이드를 참조하세요. 역할 부여에 대한 자세한 내용은 배포 권한 및 액세스 관리를 참조하세요.
요청 제한 시간 설정 및 업데이트
구성을 변경하면 새 버전이 생성됩니다. 이를 변경하는 명시적 업데이트가 없으면 이후 버전에도 이 구성 설정이 자동으로 적용됩니다.
새 서비스를 만들거나 새 버전을 배포할 때 Google Cloud 콘솔, gcloud 명령줄 또는 YAML 파일을 사용하여 요청 시간 제한을 설정할 수 있습니다.
콘솔
Google Cloud 콘솔에서 Cloud Run으로 이동합니다.
컨테이너 배포를 클릭하고 서비스를 선택하여 새 서비스를 구성합니다. 기존 서비스를 구성하는 경우 서비스를 클릭한 후 새 버전 수정 및 배포를 클릭합니다.
새 서비스를 구성하는 경우 초기 서비스 설정 페이지를 작성한 후 컨테이너, 볼륨, 네트워킹, 보안을 클릭하여 서비스 구성 페이지를 펼칩니다.
컨테이너 탭을 클릭합니다.
- In the 요청 제한 시간 필드에서 사용할 제한 시간 값을 초 단위로 입력합니다.
1
~3600
초 또는 1~60
분 사이의 값을 사용합니다.
- In the 요청 제한 시간 필드에서 사용할 제한 시간 값을 초 단위로 입력합니다.
만들기 또는 배포를 클릭합니다.
gcloud
다음 명령어를 사용하여 언제든지 지정된 버전의 요청 제한 시간을 업데이트할 수 있습니다.
gcloud run services update SERVICE --timeout=TIMEOUT
다음과 같이 바꿉니다.
- SERVICE를 서비스 이름으로 바꿉니다.
TIMEOUT을 정수 값 또는 절대 지속 시간 값을 사용하여 응답이 반환되어야 하는 시간으로 바꿉니다. 예를 들어
1m20s
는 1분 20초입니다. 정수 값을 사용하면 단위는 초로 간주됩니다. 60분 미만으로 값을 지정해야 합니다.
배포 중에 다음 명령어를 사용하여 요청 제한 시간을 설정할 수도 있습니다.
gcloud run deploy --image IMAGE_URL --timeout=TIMEOUT
다음과 같이 바꿉니다.
- IMAGE_URL: 컨테이너 이미지에 대한 참조(예:
us-docker.pkg.dev/cloudrun/container/hello:latest
). Artifact Registry를 사용하는 경우 저장소 REPO_NAME이 이미 생성되어 있어야 합니다. URL의 형식은LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG
입니다. - 정수 값 또는 기간 값(예: 1분 20초인
1m20s
)을 사용하여 응답이 반환되어야 하는 제한 시간을 TIMEOUT에 지정합니다. 정수 값을 사용하면 단위는 초로 간주됩니다. 지정하는 값은 60분 미만이어야 합니다.
YAML
새 서비스를 만드는 경우에는 이 단계를 건너뜁니다. 기존 서비스를 업데이트하는 경우 YAML 구성을 다운로드합니다.
gcloud run services describe SERVICE --format export > service.yaml
timeoutSeconds
속성을 업데이트합니다.apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: metadata: name: REVISION spec: containers: - image: IMAGE timeoutSeconds: VALUE
다음과 같이 바꿉니다.
- SERVICE: Cloud Run 서비스 이름
- IMAGE_URL: 컨테이너 이미지에 대한 참조(예:
us-docker.pkg.dev/cloudrun/container/hello:latest
). Artifact Registry를 사용하는 경우 저장소 REPO_NAME이 이미 생성되어 있어야 합니다. URL의 형식은LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG
입니다. - VALUE: 원하는 제한 시간(초 단위)
- REVISION: 새 버전 이름으로 변경하거나 이미 있는 경우 삭제. 새 버전 이름을 제공할 경우 다음 기준을 반드시 충족해야 합니다.
SERVICE-
로 시작해야 합니다.- 소문자, 숫자,
-
만 포함합니다. -
로 끝나면 안 됩니다.- 63자(영문 기준) 이하여야 합니다.
다음 명령어를 사용하여 서비스를 만들거나 업데이트합니다.
gcloud run services replace service.yaml
Terraform
Terraform 구성을 적용하거나 삭제하는 방법은 기본 Terraform 명령어를 참조하세요.
template
아래의 Terraform 구성에서 google_cloud_run_v2_service
리소스에 다음 항목을 추가합니다. 300s
를 서비스에 사용할 요청 제한 시간으로 바꿉니다.
요청 제한 시간 설정 보기
Cloud Run 서비스의 현재 요청 제한 시간 설정을 보려면 다음 안내를 따르세요.
콘솔
Google Cloud 콘솔에서 Cloud Run으로 이동합니다.
관심이 있는 서비스를 클릭하여 서비스 세부정보 페이지를 엽니다.
버전 탭을 클릭합니다.
오른쪽의 세부정보 패널에서 요청 제한 시간 설정이 컨테이너 탭에 표시됩니다.
gcloud
다음 명령어를 사용하세요.
gcloud run services describe SERVICE
반환된 구성에서 요청 제한 시간 설정을 찾습니다.