예약 소비
TPU 예약이 있는 경우 예약된 리소스를 사용하여 예약의 속성과 일치하는 TPU를 만들 수 있습니다. 이러한 작업을 예약을 사용한다고 합니다. GKE를 사용할 때 TPU 예약을 사용하는 방법에 관한 자세한 내용은 GKE 문서의 TPU 예약을 참고하세요.
특정 예약 소비
gcloud alpha compute tpus queued-resources
create
명령어로 리소스를 만들 때 --reservation
플래그를 사용하여 사용할 예약의 이름을 지정합니다. 캘린더 모드에서 생성된 미래용 예약의 경우 --provisioning-model
플래그를 reservation-bound
로 설정해야 합니다.
gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \ --node-id=TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --runtime-version=SOFTWARE_VERSION \ --reservation=RESERVATION_URL \ --provisioning-model=reservation-bound # Only required for calendar mode
다음 자리 표시자 변수를 바꿉니다.
- QUEUED_RESOURCE_ID: 큐에 추가된 리소스 요청의 사용자 할당 ID
- TPU_NAME: 큐에 추가된 리소스 요청이 할당될 때 생성되는 TPU의 사용자 할당 ID(이름)
- ZONE: TPU VM을 만들 영역. 지원되는 영역에 대한 자세한 내용은 리전 및 영역을 참고하세요.
- ACCELERATOR_TYPE: 생성할 Cloud TPU의 버전과 크기. 각 TPU 버전에서 지원되는 가속기 유형에 대한 자세한 내용은 TPU 버전을 참고하세요.
- SOFTWARE_VERSION: Cloud TPU 소프트웨어 버전
- RESERVATION_URL: 예약의 URL. 다음 값 중 하나를 지정합니다.
- 예약이 프로젝트에 있는 경우:
RESERVATION_NAME
- 예약이 다른 프로젝트에 있고 내 프로젝트에서 사용할 수 있는 경우:
projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME
- 예약이 프로젝트에 있는 경우:
일치하는 예약 소비
--reserved
플래그를 사용하여 가속기 유형, 프로젝트 ID, 영역에 따라 사용할 예약을 자동으로 결정할 수 있습니다.
CreateNode
CreateNode API를 사용하여 일치하는 예약을 사용하려면 --reserved
플래그와 함께 gcloud
alpha compute tpus tpu-vm create
명령어를 사용합니다.
gcloud alpha compute tpus tpu-vm create TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --version=SOFTWARE_VERSION \ --reserved
다음 자리 표시자 변수를 바꿉니다.
- TPU_NAME: TPU의 이름
- ZONE: TPU VM을 만들 영역. 예약 영역과 일치해야 합니다.
- ACCELERATOR_TYPE: 생성할 Cloud TPU의 버전과 크기. 각 TPU 버전에서 지원되는 가속기 유형에 대한 자세한 내용은 TPU 버전을 참고하세요.
- SOFTWARE_VERSION: Cloud TPU 소프트웨어 버전
큐에 추가된 리소스
대기열에 추가된 리소스를 사용하여 일치하는 예약을 사용하려면 --reserved
플래그와 함께 gcloud alpha compute tpus
queued-resources create
명령어를 사용합니다.
gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \ --node-id=TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --runtime-version=SOFTWARE_VERSION \ --reserved
다음 자리 표시자 변수를 바꿉니다.
- QUEUED_RESOURCE_ID: 큐에 추가된 리소스 요청의 사용자 할당 ID
- TPU_NAME: 큐에 추가된 리소스 요청이 할당될 때 생성되는 TPU의 사용자 할당 ID(이름)
- ZONE: TPU VM을 만들 영역이자 예약이 존재하는 영역
- ACCELERATOR_TYPE: 생성할 Cloud TPU의 버전과 크기. 각 TPU 버전에서 지원되는 가속기 유형에 대한 자세한 내용은 TPU 버전을 참고하세요.
- SOFTWARE_VERSION: Cloud TPU 소프트웨어 버전
예약 사용량 확인
공유 예약 사용량은 소유자 프로젝트에서만 확인할 수 있습니다. 소비자 프로젝트에 있는 경우 소유자 프로젝트로 전환하여 예약 사용량을 확인해야 합니다.
예약 중 사용 중인 부분을 확인하려면 gcloud compute
reservations describe
명령어를 사용합니다.
gcloud compute reservations describe RESERVATION_NAME \ --project=PROJECT_ID --zone=ZONE
다음 자리 표시자 변수를 바꿉니다.
- RESERVATION_NAME: 예약 이름
- PROJECT_ID: 예약이 포함된 프로젝트의 ID
- ZONE: 예약이 있는 영역
프로젝트의 모든 예약을 나열하려면 gcloud compute reservations
list
명령어를 사용합니다.
gcloud compute reservations list --project=PROJECT_ID
다음 자리표시자 변수를 바꿉니다.
- PROJECT_ID: 프로젝트의 ID