예약 소비

TPU 예약이 있는 경우 예약된 리소스를 사용하여 예약의 속성과 일치하는 TPU를 만들 수 있습니다. 이러한 작업을 예약을 사용한다고 합니다. GKE를 사용할 때 TPU 예약을 사용하는 방법에 관한 자세한 내용은 GKE 문서의 TPU 예약을 참고하세요.

특정 예약 소비

gcloud alpha compute tpus queued-resources create 명령어로 리소스를 만들 때 --reservation 플래그를 사용하여 사용할 예약의 이름을 지정합니다. 캘린더 모드에서 생성된 미래용 예약의 경우 --provisioning-model 플래그reservation-bound로 설정해야 합니다.

gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \
    --node-id=TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --runtime-version=SOFTWARE_VERSION \
    --reservation=RESERVATION_URL \
    --provisioning-model=reservation-bound # Only required for calendar mode

다음 자리 표시자 변수를 바꿉니다.

  • QUEUED_RESOURCE_ID: 큐에 추가된 리소스 요청의 사용자 할당 ID
  • TPU_NAME: 큐에 추가된 리소스 요청이 할당될 때 생성되는 TPU의 사용자 할당 ID(이름)
  • ZONE: TPU VM을 만들 영역. 지원되는 영역에 대한 자세한 내용은 리전 및 영역을 참고하세요.
  • ACCELERATOR_TYPE: 생성할 Cloud TPU의 버전과 크기. 각 TPU 버전에서 지원되는 가속기 유형에 대한 자세한 내용은 TPU 버전을 참고하세요.
  • SOFTWARE_VERSION: Cloud TPU 소프트웨어 버전
  • RESERVATION_URL: 예약의 URL. 다음 값 중 하나를 지정합니다.
    • 예약이 프로젝트에 있는 경우: RESERVATION_NAME
    • 예약이 다른 프로젝트에 있고 내 프로젝트에서 사용할 수 있는 경우: projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME

일치하는 예약 소비

--reserved 플래그를 사용하여 가속기 유형, 프로젝트 ID, 영역에 따라 사용할 예약을 자동으로 결정할 수 있습니다.

CreateNode

CreateNode API를 사용하여 일치하는 예약을 사용하려면 --reserved 플래그와 함께 gcloud alpha compute tpus tpu-vm create 명령어를 사용합니다.

gcloud alpha compute tpus tpu-vm create TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --version=SOFTWARE_VERSION \
    --reserved

다음 자리 표시자 변수를 바꿉니다.

  • TPU_NAME: TPU의 이름
  • ZONE: TPU VM을 만들 영역. 예약 영역과 일치해야 합니다.
  • ACCELERATOR_TYPE: 생성할 Cloud TPU의 버전과 크기. 각 TPU 버전에서 지원되는 가속기 유형에 대한 자세한 내용은 TPU 버전을 참고하세요.
  • SOFTWARE_VERSION: Cloud TPU 소프트웨어 버전

큐에 추가된 리소스

대기열에 추가된 리소스를 사용하여 일치하는 예약을 사용하려면 --reserved 플래그와 함께 gcloud alpha compute tpus queued-resources create 명령어를 사용합니다.

gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \
    --node-id=TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --runtime-version=SOFTWARE_VERSION \
    --reserved

다음 자리 표시자 변수를 바꿉니다.

  • QUEUED_RESOURCE_ID: 큐에 추가된 리소스 요청의 사용자 할당 ID
  • TPU_NAME: 큐에 추가된 리소스 요청이 할당될 때 생성되는 TPU의 사용자 할당 ID(이름)
  • ZONE: TPU VM을 만들 영역이자 예약이 존재하는 영역
  • ACCELERATOR_TYPE: 생성할 Cloud TPU의 버전과 크기. 각 TPU 버전에서 지원되는 가속기 유형에 대한 자세한 내용은 TPU 버전을 참고하세요.
  • SOFTWARE_VERSION: Cloud TPU 소프트웨어 버전

예약 사용량 확인

공유 예약 사용량은 소유자 프로젝트에서만 확인할 수 있습니다. 소비자 프로젝트에 있는 경우 소유자 프로젝트로 전환하여 예약 사용량을 확인해야 합니다.

예약 중 사용 중인 부분을 확인하려면 gcloud compute reservations describe 명령어를 사용합니다.

gcloud compute reservations describe RESERVATION_NAME \
    --project=PROJECT_ID --zone=ZONE

다음 자리 표시자 변수를 바꿉니다.

  • RESERVATION_NAME: 예약 이름
  • PROJECT_ID: 예약이 포함된 프로젝트의 ID
  • ZONE: 예약이 있는 영역

프로젝트의 모든 예약을 나열하려면 gcloud compute reservations list 명령어를 사용합니다.

gcloud compute reservations list --project=PROJECT_ID

다음 자리표시자 변수를 바꿉니다.

  • PROJECT_ID: 프로젝트의 ID

다음 단계