이 페이지는 Cloud Translation API를 통해 번역되었습니다.

Cloud TPU 할당량

이 문서에서는 Cloud TPU에 적용되는 할당량을 설명합니다. Cloud TPU 가격 책정에 대한 자세한 내용은 Cloud TPU 가격 책정을 참조하세요.

Google Cloud 는 공정성을 보장하고 리소스 사용 및 가용성의 급증을 줄이기 위해 할당량을 사용합니다. 할당량은 Google Cloud 프로젝트에서 사용할 수 있는Google Cloud 리소스의 양을 제한합니다. 할당량은 하드웨어, 소프트웨어, 네트워크 구성요소를 포함하여 다양한 리소스 유형에 적용됩니다. 예를 들어 할당량에 따라 서비스에 대한 API 호출 수, 프로젝트에서 동시에 사용하는 부하 분산기 수, 만들 수 있는 프로젝트 수가 제한될 수 있습니다. 할당량은 서비스 과부하를 방지하여Google Cloud 사용자 커뮤니티를 보호합니다. 또한 할당량은 자체 Google Cloud 리소스를 관리하는 데 도움이 됩니다.

Cloud Quotas 시스템은 다음을 수행합니다.

Google Cloud 제품 및 서비스 소비량 모니터링
리소스 소비 제한
할당량 값 변경을 요청하고 할당량 조정을 자동화하는 방법을 제공합니다.

대부분의 경우 할당량이 허용하는 것보다 더 많은 리소스를 소비하려고 하면 시스템에서 리소스에 대한 액세스를 차단하고 수행하려는 작업이 실패합니다.

할당량은 일반적으로 Google Cloud 프로젝트 수준에서 적용됩니다. 한 프로젝트의 리소스를 사용해도 다른 프로젝트에서 사용 가능한 할당량에는 영향을 미치지 않습니다. Google Cloud 프로젝트 내에서 할당량은 모든 애플리케이션과 IP 주소에 공유됩니다.

자세한 내용은 Cloud Quotas 개요를 참고하세요.

TPU 할당량

TPU 할당량은Google Cloud 프로젝트에 사용할 수 있는 Cloud TPU 코어 수를 제한합니다. TPU의 각 버전은 자체 할당량과 연관되어 있습니다. 또한 각 Cloud TPU 버전 할당량은 주문형 할당량과 선점형(또는 스팟) 할당량으로 나뉩니다.

Cloud TPU 리소스를 만들면 기본적으로 주문형 리소스가 생성됩니다. gcloud 명령어로 리소스를 만들 때 --spot 파라미터를 사용하면 선점형 리소스를 만들 수 있습니다. 자세한 내용은 TPU 리소스 관리를 참조하세요.

기본 Cloud TPU 할당량

다음 표에서는 각 사용 가능한 영역에 대한 주문형 및 선점형 할당량의 기본값을 보여줍니다. 이러한 값은 프로젝트 내에서 사용 가능한 최대 TPU 코어 수를 지정합니다.

선점형 할당량

TPU 버전	기본 할당량(코어 수)	할당량 이름
v6e	1536개 코어	영역별 프로젝트당 선점형 TPU v6e 코어
v5p	768개 코어	영역별 프로젝트당 선점형 TPU v5p 코어
v5e	1536개 코어	영역별 프로젝트당 선점형 TPU v5 lite 포드 코어
v4	0개 코어	영역별 프로젝트당 선점형 TPU v4 포드 코어
v3 포드	32개 코어	영역별 프로젝트당 선점형 TPU v3 포드 코어
v3	120개 코어	영역별 프로젝트당 선점형 TPU v3 코어
v2 포드	32개 코어	영역별 프로젝트당 선점형 TPU v2 포드 코어
v2	120개 코어	영역별 프로젝트당 선점형 TPU v2 코어

주문형 할당량

TPU 버전	기본 할당량(코어 수)	할당량 이름
v6e	512개 코어	영역별 프로젝트당 TPU v6e 코어
v5p	코어 128개	영역별 프로젝트당 TPU v5p 코어
v5e	512개 코어	영역별 프로젝트당 TPU v5 lite 포드 코어
v4	0개 코어	영역별 프로젝트당 TPU v4 포드 코어
v3 포드	32개 코어	영역별 프로젝트당 TPU v3 포드 코어
v3	40개 코어	영역별 프로젝트당 TPU v3 코어
v2 포드	32개 코어	영역별 프로젝트당 TPU v2 포드 코어
v2	40개 코어	영역별 프로젝트당 TPU v2 코어

추가 할당량 보기 및 요청

Google Cloud 콘솔의 할당량 페이지에서 Google Cloud 프로젝트의 할당량을 볼 수 있습니다.

추가 Cloud TPU 할당량은 할당량 페이지에서 요청할 수 있습니다. 늘리려는 할당량을 찾고, 세로 점 3개를 클릭하고 할당량 편집을 선택합니다. 자세한 내용은 할당량 조정 요청을 참조하세요. 자동 승인 기준점 아래로 할당량을 요청할 경우에는 요청이 자동으로 승인됩니다.

선점형 할당량

TPU 버전	자동 승인 기준점	할당량 이름
v6e	모든 영역: 0개 코어	영역별 프로젝트당 선점형 TPU v6e 코어
v5p	모든 영역: 0개 코어	영역별 프로젝트당 선점형 TPU v5p 코어
v5e	us-east5-b: 800개 코어 us-west4-a: 1600개 코어 us-west4-b: 3968개 코어 us-west1-c: 576개 코어 us-central1-a: 3264개 코어 europe-west4-a: 4032개 코어	영역별 프로젝트당 선점형 TPU v5 lite 포드 코어
v4	모든 영역: 0개 코어	영역별 프로젝트당 선점형 TPU v4 포드 코어
v3 포드	europe-west4-a: 512개 코어 us-east1-d: 320개 코어	영역별 프로젝트당 선점형 TPU v3 포드 코어
v3	us-central1-a: 64개 코어 europe-west4-a: 128개 코어	영역별 프로젝트당 선점형 TPU v3 코어
v2 포드	us-central1-a: 64개 코어 europe-west4-a: 64개 코어	영역별 프로젝트당 선점형 TPU v2 포드 코어
v2	us-central1-b: 128개 코어 us-central1-c: 64개 코어 us-central1-f: 128개 코어 europe-west4-a: 32개 코어	영역별 프로젝트당 선점형 TPU v2 코어

주문형 할당량

TPU 버전	자동 승인 기준점	할당량 이름
v6e	모든 영역: 0개 코어	영역별 프로젝트당 TPU v6e 코어
v5p	us-east5-a: 64개 코어	영역별 프로젝트당 TPU v5p 코어
v5e	모든 영역: 64개 코어	영역별 프로젝트당 TPU v5 lite 포드 코어
v4	모든 영역: 0개 코어	영역별 프로젝트당 TPU v4 포드 코어
v3 포드	europe-west4-a: 128개 코어 us-east1-d: 64개 코어	영역별 프로젝트당 TPU v3 포드 코어
v3	us-central1-a: 64개 코어 europe-west4-a: 128개 코어	영역별 프로젝트당 TPU v3 코어
v2 포드	us-central1-a: 64개 코어 europe-west4-a: 64개 코어	영역별 프로젝트당 TPU v2 포드 코어
v2	us-central1-b: 128개 코어 us-central1-c: 64개 코어 us-central1-f: 128개 코어 europe-west4-a: 32개 코어	영역별 프로젝트당 TPU v2 코어

할당량 요청 승인 또는 거부를 알리는 이메일이 수신됩니다.Google Cloud 서비스 할당량 증가는 점진적으로 수행됩니다. 이로 인해 여러 리전이나 리소스에 걸쳐 출시가 진행될 수 있습니다. 출시 중에 Google Cloud 콘솔 또는 Cloud Quotas API에 표시되는 할당량 값에는 출시가 완료될 때까지 새로 증가한 할당량 값이 반영되지 않습니다. 자세한 내용은 진행 중인 출시 보기를 참조하세요.