예약 사용

TPU 예약이 있는 경우 예약된 리소스를 사용하여 예약 속성과 일치하는 TPU를 만들 수 있습니다. 이 작업을 예약 사용이라고 합니다. GKE를 사용할 때 TPU 예약을 사용하는 방법에 관한 자세한 내용은 GKE 문서의 TPU 예약을 참고하세요.

특정 예약 사용

gcloud alpha compute tpus queued-resources create 명령어로 리소스를 만들 때는 --reservation 플래그를 사용하여 사용할 예약의 이름을 지정합니다. 캘린더 모드에서 생성된 향후 예약의 경우 --provisioning-model 플래그reservation-bound로 설정해야 합니다.

gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \
    --node-id=TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --runtime-version=SOFTWARE_VERSION \
    --reservation=RESERVATION_NAME \
    --provisioning-model=reservation-bound # Only required for calendar mode

다음 자리 표시자 변수를 바꿉니다.

  • QUEUED_RESOURCE_ID: 큐에 추가된 리소스 요청의 사용자 할당 ID입니다.
  • TPU_NAME: 큐에 추가된 리소스 요청이 할당될 때 생성되는 TPU의 사용자 할당 ID (이름)입니다.
  • ZONE: TPU VM을 만들 영역입니다. 지원되는 영역에 관한 자세한 내용은 리전 및 영역을 참고하세요.
  • ACCELERATOR_TYPE: 만들 Cloud TPU의 버전 및 크기를 지정합니다. 각 TPU 버전에서 지원되는 가속기 유형에 대한 자세한 내용은 TPU 버전을 참고하세요.
  • SOFTWARE_VERSION: Cloud TPU 소프트웨어 버전입니다.
  • RESERVATION_NAME: 사용할 예약의 이름입니다.

일치하는 예약 사용

--reserved 플래그를 사용하여 가속기 유형, 프로젝트 ID, 영역을 기반으로 사용할 예약을 자동으로 결정할 수 있습니다.

CreateNode

CreateNode API를 사용하여 일치하는 예약을 사용하려면 --reserved 플래그와 함께 gcloud alpha compute tpus tpu-vm create 명령어를 사용합니다.

gcloud alpha compute tpus tpu-vm create TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --version=SOFTWARE_VERSION \
    --reserved

다음 자리 표시자 변수를 바꿉니다.

  • TPU_NAME: TPU의 이름입니다.
  • ZONE: TPU VM을 만들 영역입니다. 지원되는 영역에 관한 자세한 내용은 리전 및 영역을 참고하세요.
  • ACCELERATOR_TYPE: 만들 Cloud TPU의 버전 및 크기를 지정합니다. 각 TPU 버전에서 지원되는 가속기 유형에 대한 자세한 내용은 TPU 버전을 참고하세요.
  • SOFTWARE_VERSION: Cloud TPU 소프트웨어 버전입니다.

큐에 추가된 리소스

대기열에 추가된 리소스를 사용하여 일치하는 예약을 사용하려면 --reserved 플래그와 함께 gcloud alpha compute tpus queued-resources create 명령어를 사용합니다.

gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \
    --node-id=TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --runtime-version=SOFTWARE_VERSION \
    --reserved

다음 자리 표시자 변수를 바꿉니다.

  • QUEUED_RESOURCE_ID: 큐에 추가된 리소스 요청의 사용자 할당 ID입니다.
  • TPU_NAME: 큐에 추가된 리소스 요청이 할당될 때 생성되는 TPU의 사용자 할당 ID (이름)입니다.
  • ZONE: TPU VM을 만들 영역입니다. 지원되는 영역에 관한 자세한 내용은 리전 및 영역을 참고하세요.
  • ACCELERATOR_TYPE: 만들 Cloud TPU의 버전 및 크기를 지정합니다. 각 TPU 버전에서 지원되는 가속기 유형에 대한 자세한 내용은 TPU 버전을 참고하세요.
  • SOFTWARE_VERSION: Cloud TPU 소프트웨어 버전입니다.

예약 사용량 확인

사용 중인 예약의 양을 확인하려면 gcloud compute reservations describe 명령어를 사용합니다.

gcloud compute reservations describe RESERVATION_NAME \
    --project=PROJECT_ID --zone=ZONE

다음 자리 표시자 변수를 바꿉니다.

  • RESERVATION_NAME: 예약 이름입니다.
  • PROJECT_ID: 예약이 포함된 프로젝트의 ID입니다.
  • ZONE: 예약이 있는 영역입니다.

프로젝트의 모든 예약을 나열하려면 gcloud compute reservations list 명령어를 사용합니다.

gcloud compute reservations list --project=PROJECT_ID

다음 자리표시자 변수를 바꿉니다.

  • PROJECT_ID: 프로젝트의 ID

다음 단계