Cloud TPU 할당량

이 문서에서는 Cloud TPU에 적용되는 할당량을 설명합니다. Cloud TPU 가격 책정에 대한 자세한 내용은 Cloud TPU 가격 책정을 참조하세요.

Google Cloud 는 공정성을 보장하고 리소스 사용 및 가용성의 급증을 줄이기 위해 할당량을 사용합니다. 할당량은 Google Cloud 프로젝트에서 사용할 수 있는Google Cloud 리소스의 양을 제한합니다. 할당량은 하드웨어, 소프트웨어, 네트워크 구성요소를 포함하여 다양한 리소스 유형에 적용됩니다. 예를 들어 할당량에 따라 서비스에 대한 API 호출 수, 프로젝트에서 동시에 사용하는 부하 분산기 수, 만들 수 있는 프로젝트 수가 제한될 수 있습니다. 할당량은 서비스 과부하를 방지하여Google Cloud 사용자 커뮤니티를 보호합니다. 또한 할당량은 자체 Google Cloud 리소스를 관리하는 데 도움이 됩니다.

Cloud Quotas 시스템은 다음을 수행합니다.

대부분의 경우 할당량이 허용하는 것보다 더 많은 리소스를 소비하려고 하면 시스템에서 리소스에 대한 액세스를 차단하고 수행하려는 작업이 실패합니다.

할당량은 일반적으로 Google Cloud 프로젝트 수준에서 적용됩니다. 한 프로젝트의 리소스를 사용해도 다른 프로젝트에서 사용 가능한 할당량에는 영향을 미치지 않습니다. Google Cloud 프로젝트 내에서 할당량은 모든 애플리케이션과 IP 주소에 공유됩니다.

TPU 할당량

TPU 할당량은Google Cloud 프로젝트에 사용할 수 있는 Cloud TPU 코어 수를 제한합니다. TPU의 각 버전은 자체 할당량과 연관되어 있습니다. 또한 각 Cloud TPU 버전 할당량은 주문형 할당량과 선점형(또는 스팟) 할당량으로 나뉩니다.

Cloud TPU 리소스를 만들면 기본적으로 주문형 리소스가 생성됩니다. gcloud 명령어로 리소스를 만들 때 --spot 파라미터를 사용하면 선점형 리소스를 만들 수 있습니다. 자세한 내용은 TPU 리소스 관리를 참조하세요.

기본 Cloud TPU 할당량

다음 표에서는 각 사용 가능한 영역에 대한 주문형 및 선점형 할당량의 기본값을 보여줍니다. 이러한 값은 프로젝트 내에서 사용 가능한 최대 TPU 코어 수를 지정합니다.

선점형 할당량

TPU 버전 기본 할당량(코어 수) 할당량 이름
v6e 1536개 코어 영역별 프로젝트당 선점형 TPU v6e 코어
v5p 768개 코어 영역별 프로젝트당 선점형 TPU v5p 코어
v5e 1536개 코어 영역별 프로젝트당 선점형 TPU v5 lite 포드 코어
v4 0개 코어 영역별 프로젝트당 선점형 TPU v4 포드 코어
v3 포드 32개 코어 영역별 프로젝트당 선점형 TPU v3 포드 코어
v3 120개 코어 영역별 프로젝트당 선점형 TPU v3 코어
v2 포드 32개 코어 영역별 프로젝트당 선점형 TPU v2 포드 코어
v2 120개 코어 영역별 프로젝트당 선점형 TPU v2 코어

주문형 할당량

TPU 버전 기본 할당량(코어 수) 할당량 이름
v6e 512개 코어 영역별 프로젝트당 TPU v6e 코어
v5p 128개 코어 영역별 프로젝트당 TPU v5p 코어
v5e 512개 코어 영역별 프로젝트당 TPU v5 lite 포드 코어
v4 0개 코어 영역별 프로젝트당 TPU v4 포드 코어
v3 포드 32개 코어 영역별 프로젝트당 TPU v3 포드 코어
v3 40개 코어 영역별 프로젝트당 TPU v3 코어
v2 포드 32개 코어 영역별 프로젝트당 TPU v2 포드 코어
v2 40개 코어 영역별 프로젝트당 TPU v2 코어

추가 할당량 보기 및 요청

Google Cloud 콘솔의 할당량 페이지에서 Google Cloud 프로젝트의 할당량을 볼 수 있습니다.

추가 Cloud TPU 할당량은 할당량 페이지에서 요청할 수 있습니다. 늘리려는 할당량을 찾고, 세로 점 3개를 클릭하고 할당량 편집을 선택합니다. 자세한 내용은 할당량 한도 상향 요청을 참조하세요. 자동 승인 기준점 아래로 할당량을 요청할 경우에는 요청이 자동으로 승인됩니다.

선점형 할당량

TPU 버전 자동 승인 기준점 할당량 이름
v6e 모든 영역: 0개 코어 영역별 프로젝트당 선점형 TPU v6e 코어
v5p 모든 영역: 0개 코어 영역별 프로젝트당 선점형 TPU v5p 코어
v5e
  • us-east5-b: 800개 코어
  • us-west4-a: 1600개 코어
  • us-west4-b: 3968개 코어
  • us-west1-c: 576개 코어
  • us-central1-a: 3264개 코어
  • europe-west4-a: 4032개 코어
영역별 프로젝트당 선점형 TPU v5 lite 포드 코어
v4 모든 영역: 0개 코어 영역별 프로젝트당 선점형 TPU v4 포드 코어
v3 포드
  • europe-west4-a: 512개 코어
  • us-east1-d: 320개 코어
영역별 프로젝트당 선점형 TPU v3 포드 코어
v3
  • us-central1-a: 64개 코어
  • europe-west4-a: 128개 코어
영역별 프로젝트당 선점형 TPU v3 코어
v2 포드
  • us-central1-a: 64개 코어
  • europe-west4-a: 64개 코어
영역별 프로젝트당 선점형 TPU v2 포드 코어
v2
  • us-central1-b: 128개 코어
  • us-central1-c: 64개 코어
  • us-central1-f: 128개 코어
  • europe-west4-a: 32개 코어
영역별 프로젝트당 선점형 TPU v2 코어

주문형 할당량

TPU 버전 자동 승인 기준점 할당량 이름
v6e 모든 영역: 0개 코어 영역별 프로젝트당 TPU v6e 코어
v5p us-east5-a: 64개 코어 영역별 프로젝트당 TPU v5p 코어
v5e 모든 영역: 64개 코어 영역별 프로젝트당 TPU v5 lite 포드 코어
v4 모든 영역: 0개 코어 영역별 프로젝트당 TPU v4 포드 코어
v3 포드
  • europe-west4-a: 128개 코어
  • us-east1-d: 64개 코어
영역별 프로젝트당 TPU v3 포드 코어
v3
  • us-central1-a: 64개 코어
  • europe-west4-a: 128개 코어
영역별 프로젝트당 TPU v3 코어
v2 포드
  • us-central1-a: 64개 코어
  • europe-west4-a: 64개 코어
영역별 프로젝트당 TPU v2 포드 코어
v2
  • us-central1-b: 128개 코어
  • us-central1-c: 64개 코어
  • us-central1-f: 128개 코어
  • europe-west4-a: 32개 코어
영역별 프로젝트당 TPU v2 코어

할당량 요청 승인 또는 거부를 알리는 이메일이 수신됩니다.Google Cloud 서비스 할당량 증가는 점진적으로 수행됩니다. 이로 인해 여러 리전이나 리소스에 걸쳐 출시가 진행될 수 있습니다. 출시 중에 Google Cloud 콘솔 또는 Cloud Quotas API에 표시되는 할당량 값에는 출시가 완료될 때까지 새로 증가한 할당량 값이 반영되지 않습니다. 자세한 내용은 진행 중인 출시 보기를 참조하세요.