예약 사용
TPU 예약이 있는 경우 예약된 리소스를 사용하여 예약 속성과 일치하는 TPU를 만들 수 있습니다. 이 작업을 예약 사용이라고 합니다. GKE를 사용할 때 TPU 예약을 사용하는 방법에 관한 자세한 내용은 GKE 문서의 TPU 예약을 참고하세요.
특정 예약 사용
gcloud alpha compute tpus queued-resources
create
명령어로 리소스를 만들 때는 --reservation
플래그를 사용하여 사용할 예약의 이름을 지정합니다. 캘린더 모드에서 생성된 향후 예약의 경우 --provisioning-model
플래그도 reservation-bound
로 설정해야 합니다.
gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \ --node-id=TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --runtime-version=SOFTWARE_VERSION \ --reservation=RESERVATION_NAME \ --provisioning-model=reservation-bound # Only required for calendar mode
다음 자리 표시자 변수를 바꿉니다.
- QUEUED_RESOURCE_ID: 큐에 추가된 리소스 요청의 사용자 할당 ID입니다.
- TPU_NAME: 큐에 추가된 리소스 요청이 할당될 때 생성되는 TPU의 사용자 할당 ID (이름)입니다.
- ZONE: TPU VM을 만들 영역입니다. 지원되는 영역에 관한 자세한 내용은 리전 및 영역을 참고하세요.
- ACCELERATOR_TYPE: 만들 Cloud TPU의 버전 및 크기를 지정합니다. 각 TPU 버전에서 지원되는 가속기 유형에 대한 자세한 내용은 TPU 버전을 참고하세요.
- SOFTWARE_VERSION: Cloud TPU 소프트웨어 버전입니다.
- RESERVATION_NAME: 사용할 예약의 이름입니다.
일치하는 예약 사용
--reserved
플래그를 사용하여 가속기 유형, 프로젝트 ID, 영역을 기반으로 사용할 예약을 자동으로 결정할 수 있습니다.
CreateNode
CreateNode API를 사용하여 일치하는 예약을 사용하려면 --reserved
플래그와 함께 gcloud
alpha compute tpus tpu-vm create
명령어를 사용합니다.
gcloud alpha compute tpus tpu-vm create TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --version=SOFTWARE_VERSION \ --reserved
다음 자리 표시자 변수를 바꿉니다.
- TPU_NAME: TPU의 이름입니다.
- ZONE: TPU VM을 만들 영역입니다. 지원되는 영역에 관한 자세한 내용은 리전 및 영역을 참고하세요.
- ACCELERATOR_TYPE: 만들 Cloud TPU의 버전 및 크기를 지정합니다. 각 TPU 버전에서 지원되는 가속기 유형에 대한 자세한 내용은 TPU 버전을 참고하세요.
- SOFTWARE_VERSION: Cloud TPU 소프트웨어 버전입니다.
큐에 추가된 리소스
대기열에 추가된 리소스를 사용하여 일치하는 예약을 사용하려면 --reserved
플래그와 함께 gcloud alpha compute tpus
queued-resources create
명령어를 사용합니다.
gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \ --node-id=TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --runtime-version=SOFTWARE_VERSION \ --reserved
다음 자리 표시자 변수를 바꿉니다.
- QUEUED_RESOURCE_ID: 큐에 추가된 리소스 요청의 사용자 할당 ID입니다.
- TPU_NAME: 큐에 추가된 리소스 요청이 할당될 때 생성되는 TPU의 사용자 할당 ID (이름)입니다.
- ZONE: TPU VM을 만들 영역입니다. 지원되는 영역에 관한 자세한 내용은 리전 및 영역을 참고하세요.
- ACCELERATOR_TYPE: 만들 Cloud TPU의 버전 및 크기를 지정합니다. 각 TPU 버전에서 지원되는 가속기 유형에 대한 자세한 내용은 TPU 버전을 참고하세요.
- SOFTWARE_VERSION: Cloud TPU 소프트웨어 버전입니다.
예약 사용량 확인
사용 중인 예약의 양을 확인하려면 gcloud compute
reservations describe
명령어를 사용합니다.
gcloud compute reservations describe RESERVATION_NAME \ --project=PROJECT_ID --zone=ZONE
다음 자리 표시자 변수를 바꿉니다.
- RESERVATION_NAME: 예약 이름입니다.
- PROJECT_ID: 예약이 포함된 프로젝트의 ID입니다.
- ZONE: 예약이 있는 영역입니다.
프로젝트의 모든 예약을 나열하려면 gcloud compute reservations
list
명령어를 사용합니다.
gcloud compute reservations list --project=PROJECT_ID
다음 자리표시자 변수를 바꿉니다.
- PROJECT_ID: 프로젝트의 ID