Cloud Run 서비스 구성

이 페이지에서는 Cloud Run 서비스의 구성 옵션을 간략하게 설명합니다.

콜드 스타트 방지 및 지연 시간 단축

최소 인스턴스 수를 설정하면 애플리케이션의 콜드 스타트를 방지하고 애플리케이션 지연 시간을 줄일 수 있습니다. 최소 인스턴스 수를 설정하면 비용이 발생합니다. 자세한 내용은 서비스의 최소 인스턴스 설정을 참고하세요.

용량

서비스에서 사용할 수 있는 메모리, CPU, 최대 동시 실행을 제어할 수 있습니다.

결제 설정을 사용하여 요청당 요금이 청구되는 방식, 인스턴스가 요청을 처리할 때만 요금이 청구되는 방식, 인스턴스의 전체 수명 주기에 대해 요금이 청구되는 방식을 제어합니다.

환경 변수

Cloud Run 서비스에 사용할 키-값 쌍을 만들 수 있습니다. 자세한 내용은 서비스의 환경 변수 구성을 참고하세요.

실행 환경

Cloud Run에는 두 가지 실행 환경이 있습니다. 두 실행 환경의 차이점 알아보기

GPU

추론 모델 및 모델 학습과 같은 AI 워크로드를 호스팅해야 하는 경우 GPU 유무와 관계없이 Cloud Run 서비스를 구성할 수 있습니다.

많은 요청 방지

최대 인스턴스최소 인스턴스를 설정하여 Cloud Run 서비스가 요청을 처리하기 위해 생성하는 인스턴스 수를 제어할 수 있습니다. 이렇게 하면 비용을 줄이고 비정상적으로 높은 요청 수준을 방지하는 데 도움이 될 수 있습니다.

상태 점검

Cloud Run을 사용하면 두 가지 유형의 상태 점검 프로브를 구성할 수 있습니다. 프로브 중 하나는 컨테이너가 트래픽을 수락할 준비가 되었는지 확인하고 다른 프로브는 컨테이너를 다시 시작할지 여부를 결정합니다. 컨테이너 상태 확인에 대해 자세히 알아보세요.

확장

기본적으로 Cloud Run은 트래픽 및 CPU 사용률에 따라 지정된 최대 인스턴스 수 또는 기본 최대 인스턴스 수로 자동 확장됩니다. 하지만 일부 사용 사례에서는 수동 확장을 사용하여 특정 인스턴스 수를 설정하는 기능이 필요할 수 있습니다.

보안 비밀

Cloud Run과 함께 Secret Manager를 사용하여 API 키, 비밀번호, 기타 민감한 정보를 안전하게 저장할 수 있습니다. 자세한 내용은 보안 비밀 구성을 참고하세요.

서비스 ID

Cloud Run 서비스 ID는 Cloud Run 인스턴스 컨테이너에서Google Cloud API에 액세스할 수 있도록 인증된 계정으로 사용되는 서비스 계정입니다. 서비스 계정을 만들고 서비스 계정에서 특정 Google Cloud리소스에 액세스하는 데 필요한 최소한의 권한 집합을 결정하는 것이 좋습니다.

제한 시간

응답을 반환해야 하는 시간을 지정하는 Cloud Run 요청 제한 시간을 설정할 수 있습니다.

권장사항

Cloud Run에서 추천자가 제공하는 최적화에 대해 알아보려면 추천 도구로 최적화를 참고하세요.

트래픽 분할

서비스를 배포 또는 재배포할 때마다 기본 Cloud Run 서비스의 새 버전이 자동으로 생성됩니다. 자세한 내용은 세션 어피니티 및 트래픽 분할을 참고하세요.

태그 서비스

태그는 Cloud Run Console을 사용하여 세분화된 액세스 제어를 위해 리소스에 적용할 수 있는 키-값 쌍입니다.

태그 관리자는 조직 또는 프로젝트 수준에서 Google Cloud 간에 리소스 태그를 만듭니다. 태그를 사용하면 리소스에 특정 태그가 있는지 여부에 따라 조건부로 정책을 허용하거나 거부할 수 있습니다. 자세한 내용은 태그 서비스를 참고하세요.

볼륨 마운트

Cloud Run 볼륨 마운트를 사용하면 컨테이너에서 스토리지 버킷 또는 파일 서버 콘텐츠와 같이 로컬 파일 시스템에 저장된 공유 데이터에 액세스할 수 있습니다. Cloud Storage 버킷, Filestore 인스턴스와 같은 NFS 공유, Cloud Run에서 제공하는 메모리 내 파일 시스템 또는 NBD, 9P, CIFS/Samba, Ceph 네트워크 파일 시스템을 마운트할 수 있습니다.