캘린더 모드에서 미래용 예약 요청 만들기

이 문서에서는 캘린더 모드에서 미래용 예약 요청을 만드는 방법을 설명합니다. 이러한 요청을 사용하여 최대 90일 동안 실행되는 GPU 또는 TPU가 연결된 가상 머신(VM) 인스턴스를 만들기 위해 수요가 많은 리소스를 예약할 수 있습니다.

캘린더 모드에서 미래용 예약 요청을 사용하여 다음 워크로드를 실행하기 위해 수요가 많은 리소스를 예약할 수 있습니다.

모델 사전 학습 작업
모델 미세 조정 작업
고성능 컴퓨팅(HPC) 시뮬레이션 워크로드
추론 워크로드의 단기 증가

Google Cloud 에서 캘린더 모드의 요청을 승인하면 지정된 제공 날짜와 시간에 GPU 또는 TPU VM을 만들 수 있도록 예약된 리소스가 제공됩니다. 캘린더 모드에서 요청을 만들 때 적용되는 요구사항 및 제한사항에 대해 자세히 알아보려면 캘린더 모드의 미래용 예약 요청 개요를 참조하세요.

시작하기 전에

캘린더 모드에서 미래용 예약 요청을 사용할 수 없으면 이 기능에 액세스하여 사용할 수 없습니다. 이 경우 계정팀 또는 영업팀에 문의하세요.
조직 내 다른 프로젝트와 예약된 용량을 공유하려면 캘린더 모드에서 미래용 예약 요청을 만들려는 프로젝트가 공유 예약을 만들 수 있도록 허용되어 있어야 합니다. 그렇지 않으면 오류가 발생합니다.
아직 인증을 설정하지 않았다면 설정합니다. 인증은 Google Cloud 서비스 및 API에 액세스하기 위해 ID를 확인합니다. 로컬 개발 환경에서 코드 또는 샘플을 실행하려면 다음 옵션 중 하나를 선택하여 Compute Engine에 인증하면 됩니다.
Select the tab for how you plan to use the samples on this page:
Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
1. Google Cloud CLI를 설치합니다. 설치 후 다음 명령어를 실행하여 Google Cloud CLI를 초기화합니다.
  gcloud init
  외부 ID 공급업체(IdP)를 사용하는 경우 먼저 제휴 ID로 gcloud CLI에 로그인해야 합니다.
  
  참고: 이전에 gcloud CLI를 설치했으면 gcloud components update를 실행하여 최신 버전이 설치되어 있는지 확인하세요.
2. Set a default region and zone.
REST

로컬 개발 환경에서 이 페이지의 REST API 샘플을 사용하려면 gcloud CLI에 제공한 사용자 인증 정보를 사용합니다.
자세한 내용은 Google Cloud 인증 문서의 REST 사용을 위한 인증을 참조하세요.

필요한 역할

캘린더 모드에서 미래용 예약 요청을 만드는 데 필요한 권한을 얻으려면 관리자에게 프로젝트에 대한 Compute 미래용 예약 사용자(roles/compute.futureReservationUser) IAM 역할을 부여해 달라고 요청하세요. 역할 부여에 대한 자세한 내용은 프로젝트, 폴더, 조직에 대한 액세스 관리를 참조하세요.

이 사전 정의된 역할에는 캘린더 모드에서 미래용 예약 요청을 만드는 데 필요한 권한이 포함되어 있습니다. 필요한 정확한 권한을 보려면 필수 권한 섹션을 펼치세요.

필수 권한

캘린더 모드에서 미래용 예약 요청을 만들려면 다음 권한이 필요합니다.

미래용 예약 요청 만들기: 프로젝트에 대한 compute.futureReservations.create 권한
Compute Engine에서 예약을 자동으로 만들 수 있게 하려는 경우: 프로젝트에 대한 compute.reservations.create 권한
인스턴스 템플릿을 지정하려는 경우: 인스턴스 템플릿에 대한 compute.instanceTemplates.useReadOnly 권한
리소스의 미래 가용성을 보려는 경우: 프로젝트에 대한 compute.advice.calendarMode 권한

커스텀 역할이나 다른 사전 정의된 역할을 사용하여 이 권한을 부여받을 수도 있습니다.

개요

캘린더 모드에서 미래용 예약 요청을 만들려면 다음 단계를 완료하세요.

리소스의 향후 가용성 보기. 예약하려는 GPU VM 또는 TPU의 향후 가용성을 확인합니다. 그런 다음 요청을 만들 때 사용 가능한 것으로 확인된 리소스의 수, 유형, 예약 기간을 지정합니다. 이 정보를 제공하면 Google Cloud 에서 요청을 승인할 가능성이 높아집니다.

참고: Google Cloud 콘솔을 사용하여 요청을 만드는 경우 이 단계를 건너뛰세요. 요청을 만드는 동안 GPU VM 또는 TPU의 향후 가용성을 확인할 수 있습니다.
GPU VM 또는 TPU 예약 요청 만들기. GPU VM 또는 TPU의 캘린더 모드에서 미래용 예약 요청을 만들고 제출합니다. 요청을 성공적으로 만들 수 있으면 Google Cloud 에서 1분 이내에 승인합니다.

리소스의 향후 가용성 보기

다음과 같이 리전의 GPU VM 또는 TPU의 향후 가용성을 확인할 수 있습니다.

GPU VM의 경우 최대 60일 전
TPU의 경우 최대 120일 전

리전의 GPU VM 또는 TPU의 향후 가용성을 보려면 다음 옵션 중 하나를 선택합니다.

콘솔

캘린더 모드에서 미래용 예약 요청을 만들 때 리전의 GPU VM 또는 TPU의 향후 가용성을 확인할 수 있습니다. 자세한 내용은 이 문서의 GPU VM 또는 TPU 예약 요청 만들기를 참조하세요.

gcloud

리전에서 GPU VM 또는 TPU 향후 가용성을 보려면 다음 gcloud beta compute advice calendar-mode 명령어 중 하나를 사용합니다. 확인하려는 리소스에 따라 다음 플래그를 포함합니다.

GPU VM 가용성을 확인하려면 --vm-count 및 --machine-type 플래그를 포함합니다.

gcloud beta compute advice calendar-mode \
    --vm-count=NUMBER_OF_VMS \
    --machine-type=MACHINE_TYPE \
    --region=REGION \
    --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
    --end-time-range=from=FROM_END_TIME,to=TO_END_TIME

TPU 가용성을 확인하려면 --chip-count 및 --tpu-version 플래그를 포함하세요.

gcloud beta compute advice calendar-mode \
    --chip-count=NUMBER_OF_CHIPS \
    --tpu-version=TPU_VERSION \
    --region=REGION \
    --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \
    --end-time-range=from=FROM_END_TIME,to=TO_END_TIME

다음을 바꿉니다.

NUMBER_OF_VMS: 예약할 GPU VM 수입니다. 값은 1에서 80 사이여야 합니다.
MACHINE_TYPE: 예약할 GPU 머신 유형입니다. 다음 값 중 하나를 지정합니다.
- A4 머신 유형: a4-highgpu-8g
- A3 Ultra 머신 유형: a3-ultragpu-8g
NUMBER_OF_CHIPS: 예약할 TPU 칩 수로 바꿉니다. 값은 1, 4, 8, 16, 32, 64, 128, 256, 512 또는 1024이어야 합니다.
TPU_VERSION: 예약할 TPU 버전으로 바꿉니다. 다음 값 중 하나를 지정합니다.
- TPU v6e: V6E
- TPU v5p: V5P
- TPU v5e: V5E
TPU v5e를 지정하는 경우 --workload-type 플래그를 포함해야 합니다. 이 플래그를 TPU에서 실행하려는 워크로드 유형으로 설정합니다.
- 머신러닝(ML) 학습 워크로드와 같이 단일 또는 여러 작업에서 대량의 데이터를 처리하는 워크로드의 경우 BATCH를 지정합니다.
- ML 추론 워크로드와 같이 동시 요청을 처리하고 최소한의 네트워크 지연 시간이 필요한 워크로드의 경우에는 SERVING을 지정합니다.
  
  참고: SERVING을 지정하는 경우 TPU v5e 칩 1개, 4개 또는 8개만 예약할 수 있습니다.
REGION: GPU VM 또는 TPU를 예약할 리전입니다. 지원되는 리전 및 영역을 확인하려면 제한사항을 참조하세요.
FROM_START_TIME 및 TO_START_TIME: 용량을 예약하려는 가장 빠른 날짜와 가장 늦은 날짜로 바꿉니다. 다음 날짜를 RFC 3339 타임스탬프 형식으로 지정하세요.
```
YYYY-MM-DDTHH:MM:SSOFFSET
```
다음을 바꿉니다.
- YYYY-MM-DD: 4자리 연도, 2자리 월, 2자리 일이 하이픈(-)으로 구분된 형식의 날짜로 바꿉니다.
- HH:MM:SS: 24시간제의 2자리 시간, 2자리 분, 2자리 초가 콜론(:)으로 구분된 형식의 시간으로 바꿉니다.
- OFFSET: 협정 세계시(UTC)의 오프셋 형식으로 지정된 시간대입니다. 예를 들어 태평양 표준시(PST)를 사용하려면 -08:00을 지정합니다. 오프셋을 사용하지 않으려면 Z를 지정합니다.
FROM_END_TIME 및 TO_END_TIME: 용량 예약이 종료되기를 원하는 가장 빠른 날짜와 가장 늦은 날짜입니다. 다음 날짜를 RFC 3339 타임스탬프 형식으로 지정하세요. 종료 시간 대신 예약 기간의 범위를 지정하려면 --end-time-range 플래그를 --duration-range 플래그로 바꿉니다.

출력은 다음과 비슷합니다.

- recommendationsPerSpec:
    spec:
      endTime: '2025-09-07T00:00:00Z'
      location: zones/us-east5-a
      otherLocations:
        zones/us-east5-b:
          details: this machine family is not supported in this zone
          status: NOT_SUPPORTED
        zones/us-east5-c:
          details: this machine family is not supported in this zone
          status: NOT_SUPPORTED
      recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb
      recommendationType: FUTURE_RESERVATION
      startTime: '2025-06-09T00:00:00Z'

요청한 리소스를 사용할 수 있으면 출력에 startTime, endTime, location 필드가 포함됩니다. 이러한 필드는 리소스를 사용할 수 있는 가장 빠른 시작 시간, 가장 늦은 종료 시간, 영역을 지정합니다.

REST

리전에서 GPU VM 또는 TPU의 향후 가용성을 보려면 베타 advice.calendarMode 메서드에 대해 GET 요청을 수행합니다. 확인하려는 리소스에 따라 요청 본문에 다음 필드를 포함합니다.

GPU VM 가용성을 보려면 instanceCount 및 machineType 필드를 포함하세요.

POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode

{
  "futureResourcesSpecs": {
    "spec": {
      "targetResources": {
        "specificSkuResources": {
          "instanceCount": "NUMBER_OF_VMS",
          "machineType": "MACHINE_TYPE"
        }
      },
      "timeRangeSpec": {
        "startTimeNotEarlierThan": "FROM_START_TIME",
        "startTimeNotLaterThan": "TO_START_TIME",
        "endTimeNotEarlierThan": "FROM_END_TIME",
        "endTimeNotLaterThan": "TO_END_TIME"
      }
    }
  }
}

TPU 가용성을 확인하려면 acceleratorCount 및 vmFamily 필드를 포함하세요.

POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode

{
  "futureResourcesSpecs": {
    "spec": {
      "targetResources": {
        "aggregateResources": {
          "acceleratorCount": "NUMBER_OF_CHIPS",
          "vmFamily": "TPU_VERSION"
        }
      },
      "timeRangeSpec": {
        "startTimeNotEarlierThan": "FROM_START_TIME",
        "startTimeNotLaterThan": "TO_START_TIME",
        "endTimeNotEarlierThan": "FROM_END_TIME",
        "endTimeNotLaterThan": "TO_END_TIME"
      }
    }
  }
}

다음을 바꿉니다.

PROJECT_ID: 리소스를 예약하려는 프로젝트의 ID입니다.
REGION: GPU VM 또는 TPU를 예약할 리전입니다. 지원되는 리전 및 영역을 확인하려면 제한사항을 참조하세요.
NUMBER_OF_VMS: 예약할 GPU VM 수입니다. 값은 1에서 80 사이여야 합니다.
MACHINE_TYPE: 예약할 GPU 머신 유형입니다. 다음 값 중 하나를 지정합니다.
- A4 머신 유형: a4-highgpu-8g
- A3 Ultra 머신 유형: a3-ultragpu-8g
NUMBER_OF_CHIPS: 예약할 TPU 칩 수로 바꿉니다. 값은 1, 4, 8, 16, 32, 64, 128, 256, 512 또는 1024이어야 합니다.
TPU_VERSION: 예약할 TPU 버전으로 바꿉니다. 다음 값 중 하나를 지정합니다.
- TPU v6e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E
- TPU v5p: VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P
- TPU v5e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
TPU v5e를 지정하는 경우 aggregateResources 필드에 workloadType 필드를 포함해야 합니다. 이 필드를 TPU에서 실행할 워크로드 유형으로 설정합니다.
- 머신러닝(ML) 학습 워크로드와 같이 단일 또는 여러 작업에서 대량의 데이터를 처리하는 워크로드의 경우 BATCH를 지정합니다.
- ML 추론 워크로드와 같이 동시 요청을 처리하고 최소한의 네트워크 지연 시간이 필요한 워크로드의 경우에는 SERVING을 지정합니다.
  
  참고: SERVING을 지정하는 경우 TPU v5e 칩 1개, 4개 또는 8개만 예약할 수 있습니다.
FROM_START_TIME 및 TO_START_TIME: 용량을 예약하려는 가장 빠른 날짜와 가장 늦은 날짜로 바꿉니다. 다음 날짜를 RFC 3339 타임스탬프 형식으로 지정하세요.
```
YYYY-MM-DDTHH:MM:SSOFFSET
```
다음을 바꿉니다.
- YYYY-MM-DD: 4자리 연도, 2자리 월, 2자리 일이 하이픈(-)으로 구분된 형식의 날짜로 바꿉니다.
- HH:MM:SS: 24시간제의 2자리 시간, 2자리 분, 2자리 초가 콜론(:)으로 구분된 형식의 시간으로 바꿉니다.
- OFFSET: 협정 세계시(UTC)의 오프셋 형식으로 지정된 시간대입니다. 예를 들어 태평양 표준시(PST)를 사용하려면 -08:00을 지정합니다. 오프셋을 사용하지 않으려면 Z를 지정합니다.
FROM_END_TIME 및 TO_END_TIME: 용량 예약이 종료되기를 원하는 가장 빠른 날짜와 가장 늦은 날짜입니다. 다음 날짜를 RFC 3339 타임스탬프 형식으로 지정하세요. 종료 시간 대신 예약 기간의 기간 범위를 지정하려면 endTimeNotEarlierThan 및 endTimeNotLaterThan 필드를 minDuration 및 maxDuration 필드로 바꿉니다.

출력은 다음과 비슷합니다.

{
  "recommendations": [
    {
      "recommendationsPerSpec": {
        "spec": {
          "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b",
          "recommendationType": "FUTURE_RESERVATION",
          "startTime": "2025-06-09T00:00:00Z",
          "endTime": "2025-09-07T00:00:00Z",
          "otherLocations": {
            "zones/us-east5-b": {
              "status": "NOT_SUPPORTED",
              "details": "this machine family is not supported in this zone"
            },
            "zones/us-east5-c": {
              "status": "NOT_SUPPORTED",
              "details": "this machine family is not supported in this zone"
            }
          },
          "location": "zones/us-east5-a"
        }
      }
    }
  ]
}

GPU VM 또는 TPU 예약 요청 만들기

캘린더 모드에서 미래용 예약 요청을 만들 때는 다음과 같이 예약 기간만 지정할 수 있습니다.

시작 시간: 예약하려는 리소스에 따라 요청을 만들고 제출하는 시점으로부터 다음 값 중 하나 이상인 시작 시간을 지정해야 합니다.
- GPU VM의 경우 87시간(3일 15시간)
- TPU의 경우 6시간
종료 시간: 최대 90일 동안 리소스를 예약할 수 있습니다.

기존 GPU VM을 참조로 사용하여 요청을 만들려면Google Cloud 콘솔을 사용합니다. 그렇지 않으면 다음 옵션 중 하나를 선택합니다.

콘솔

Google Cloud 콘솔에서 예약 페이지로 이동합니다.

예약으로 이동
미래용 예약 탭을 클릭합니다.
미래용 예약 만들기를 클릭합니다. 미래용 예약 만들기 페이지가 표시되고 하드웨어 구성 창이 선택됩니다.
구성 섹션에서 다음 중 하나를 수행하여 예약하려는 GPU VM 또는 TPU의 속성을 지정합니다.
- GPU VM 또는 TPU 속성을 직접 지정하려면 다음 단계를 완료하세요.
  1. 머신 유형 지정을 선택합니다.
  2. GPU 또는 TPU 탭을 클릭한 다음 예약할 GPU 머신 유형 또는 TPU 버전을 선택합니다.
- 기존 인스턴스 템플릿을 사용하여 GPU VM 속성을 지정하려면 인스턴스 템플릿을 선택한 다음 템플릿을 선택합니다.
- 기존 VM을 참조로 사용하여 GPU VM 속성을 지정하려면 기존 VM 사용을 선택한 후 VM을 선택합니다.
이전 단계에서 TPU v5e(CT5LP)를 지정한 경우 TPU v5 워크로드 유형 목록에서 다음 옵션 중 하나를 선택합니다.
- ML 학습 워크로드와 같이 단일 또는 여러 작업에서 대량의 데이터를 처리하는 TPU에서 워크로드를 실행하려면 일괄을 선택합니다.
- ML 추론 워크로드와 같이 동시 요청을 처리하고 최소한의 네트워크 지연 시간이 필요한 TPU에서 워크로드를 실행하려면 서빙을 선택합니다.
  
  참고: 서빙을 선택하면 TPU v5e 칩 1개, 4개 또는 8개만 예약할 수 있습니다.
용량 검색 섹션에서 다음 단계를 완료합니다.
1. 리전 및 영역 목록에서 리소스를 예약하려는 리전과 영역을 지정합니다. 지원되는 리전 및 영역을 검토하려면 제한사항을 참조하세요.
2. 필요한 총 용량 필드(GPU VM 예약 시) 또는 칩 수 목록(TPU 예약 시)에서 예약할 GPU VM 또는 TPU 칩 수를 지정합니다. 다음 값을 지정할 수 있습니다.
  - GPU VM의 경우 1~80 사이의 값
  - TPU 칩의 경우 1, 4, 8, 16, 32, 64, 128, 256, 512 또는 1024의 값
3. 시작 시간 목록에서 요청 시작 시간을 선택합니다.
4. 선택사항: 시작일 유연성 선택 목록에서 시작일의 정확도를 선택합니다.
5. 예약 기간 필드에서 리소스를 예약할 기간을 지정합니다.
6. 용량 검색을 클릭합니다. 그런 다음 사용 가능한 용량 표에서 예약할 GPU VM 또는 TPU의 유형, 수, 예약 기간이 포함된 사용 가능한 옵션 중 하나를 선택합니다.
다음을 클릭합니다.
공유 유형 섹션에서 요청한 용량을 공유할 프로젝트를 선택합니다.
- 프로젝트 내에서만 예약된 용량을 사용하려면 로컬을 선택합니다.
- 예약된 용량을 다른 프로젝트와 공유하려면 공유를 선택하고 프로젝트 추가를 클릭한 후 메시지에 따라 프로젝트를 선택합니다.
다음을 클릭합니다.
미래용 예약 이름 필드에 요청 이름을 입력합니다.
예약 이름 필드에 Compute Engine에서 요청된 용량을 프로비저닝하도록 자동으로 만드는 예약의 이름을 입력합니다.
만들기를 클릭합니다.

gcloud

캘린더 모드에서 미래용 예약 요청을 만들고 검토를 위해 제출하려면 다음 gcloud beta compute future-reservations create 명령어 중 하나를 사용합니다. 예약하려는 리소스에 따라 다음 플래그를 포함합니다.

GPU VM을 예약하려면 --total-count, --machine-type, --deployment-type=DENSE 플래그를 포함합니다.

gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \
    --auto-delete-auto-created-reservations \
    --total-count=NUMBER_OF_VMS \
    --machine-type=MACHINE_TYPE \
    --deployment-type=DENSE \
    --planning-status=SUBMITTED \
    --require-specific-reservation \
    --reservation-mode=CALENDAR \
    --reservation-name=RESERVATION_NAME \
    --share-setting=SHARE_TYPE \
    --start-time=START_TIME \
    --end-time=END_TIME \
    --zone=ZONE

TPU를 예약하려면 --chip-count 및 --tpu-version 플래그를 포함합니다.

gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \
    --auto-delete-auto-created-reservations \
    --chip-count=NUMBER_OF_CHIPS \
    --tpu-version=TPU_VERSION \
    --planning-status=SUBMITTED \
    --require-specific-reservation \
    --reservation-mode=CALENDAR \
    --reservation-name=RESERVATION_NAME \
    --share-setting=SHARE_TYPE \
    --start-time=START_TIME \
    --end-time=END_TIME \
    --zone=ZONE

다음을 바꿉니다.

FUTURE_RESERVATION_NAME: 요청의 이름입니다.
NUMBER_OF_VMS: 예약할 GPU VM 수입니다. 값은 1에서 80 사이여야 합니다.
MACHINE_TYPE: 예약할 GPU 머신 유형입니다. 다음 값 중 하나를 지정합니다.
- A4 머신 유형: a4-highgpu-8g
- A3 Ultra 머신 유형: a3-ultragpu-8g
NUMBER_OF_CHIPS: 예약할 TPU 칩 수로 바꿉니다. 값은 1, 4, 8, 16, 32, 64, 128, 256, 512 또는 1024이어야 합니다.
TPU_VERSION: 예약할 TPU 버전으로 바꿉니다. 다음 값 중 하나를 지정합니다.
- TPU v6e: V6E
- TPU v5p: V5P
- TPU v5e: V5E
TPU v5e를 지정하는 경우 --workload-type 플래그를 포함해야 합니다. 플래그를 TPU에서 실행할 워크로드 유형으로 설정합니다.
- 머신러닝(ML) 학습 워크로드와 같이 단일 또는 여러 작업에서 대량의 데이터를 처리하는 워크로드의 경우 BATCH를 지정합니다.
- ML 추론 워크로드와 같이 동시 요청을 처리하고 최소한의 네트워크 지연 시간이 필요한 워크로드의 경우에는 SERVING을 지정합니다.
  
  참고: SERVING을 지정하는 경우 TPU v5e 칩 1개, 4개 또는 8개만 예약할 수 있습니다.
RESERVATION_NAME: Compute Engine에서 요청된 용량을 프로비저닝하기 위해 자동으로 생성하는 예약의 이름입니다.
SHARE_TYPE: 조직의 다른 프로젝트에서 예약된 용량을 사용할 수 있는지 여부입니다. 다음 값 중 하나를 지정합니다.
- 프로젝트 내에서만 용량을 사용하려는 경우: local
- 다른 프로젝트와 용량을 공유하려는 경우: projects
projects를 지정하는 경우 --share-with 플래그를 포함해야 합니다. 이 플래그에는 쉼표로 구분된 프로젝트 ID 목록을 설정합니다(예: project-1,project-2). 조직 내에서 최대 100개의 프로젝트를 지정할 수 있습니다. 이 목록에 프로젝트 ID를 포함하지 마세요. 기본적으로 예약된 용량을 사용할 수 있습니다.
START_TIME: 요청의 시작 시간으로, RFC 3339 타임스탬프로 형식이 지정됩니다.
END_TIME: RFC 3339 타임스탬프 형식의 예약 기간의 종료 시간. 종료 시간 대신 예약 기간을 초 단위로 지정하려면 --end-time 플래그를 --duration 플래그로 바꿉니다.
ZONE: 리소스를 예약하려는 영역

REST

캘린더 모드에서 미래용 예약 요청을 만들어 검토를 위해 제출하려면 베타 futureReservations.insert 메서드에 다음 POST 요청을 전송합니다. 예약하려는 리소스에 따라 요청 본문에 다음 필드를 포함합니다.

GPU VM을 예약하려면 totalCount 및 machineType 필드와 deploymentType 필드를 DENSE로 설정하여 포함합니다.

POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations

{
  "name": "FUTURE_RESERVATION_NAME",
  "autoDeleteAutoCreatedReservations": true,
  "deploymentType": "DENSE",
  "planningStatus": "SUBMITTED",
  "reservationMode": "CALENDAR",
  "reservationName": "RESERVATION_NAME",
  "shareSettings": {
    "shareType": "SHARE_TYPE"
  },
  "specificReservationRequired": true,
  "specificSkuProperties": {
    "totalCount": NUMBER_OF_VMS,
    "instanceProperties": {
      "machineType": "MACHINE_TYPE"
    }
  },
  "timeWindow": {
    "startTime": "START_TIME",
    "endTime": "END_TIME"
  }
}

TPU를 예약하려면 acceleratorCount 및 vmFamily 필드를 포함하세요.

POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations

{
  "name": "FUTURE_RESERVATION_NAME",
  "autoDeleteAutoCreatedReservations": true,
  "planningStatus": "SUBMITTED",
  "reservationMode": "CALENDAR",
  "reservationName": "RESERVATION_NAME",
  "shareSettings": {
    "shareType": "SHARE_TYPE"
  },
  "specificReservationRequired": true,
  "aggregateReservation": {
    "reservedResources": [
      {
        "accelerator": {
          "acceleratorCount": NUMBER_OF_CHIPS
        }
      }
    ],
    "vmFamily": "TPU_VERSION"
  },
  "timeWindow": {
    "startTime": "START_TIME",
    "endTime": "END_TIME"
  }
}

다음을 바꿉니다.

PROJECT_ID: 스냅샷을 만들려는 프로젝트의 ID로 바꿉니다.
ZONE: 리소스를 예약하려는 영역
FUTURE_RESERVATION_NAME: 요청의 이름입니다.
RESERVATION_NAME: Compute Engine에서 요청된 용량을 프로비저닝하기 위해 자동으로 생성하는 예약의 이름입니다.
SHARE_TYPE: 조직의 다른 프로젝트에서 예약된 용량을 사용할 수 있는지 여부입니다. 다음 값 중 하나를 지정합니다.
- 프로젝트 내에서만 용량을 사용하려는 경우: LOCAL
- 다른 프로젝트와 용량을 공유하려는 경우: SPECIFIC_PROJECTS
SPECIFIC_PROJECTS를 지정하는 경우 shareSettings 필드에 projectMap 필드를 포함하여 용량을 공유할 프로젝트를 지정해야 합니다. 조직 내에서 최대 100개의 프로젝트를 지정할 수 있습니다. 프로젝트 ID는 지정하지 마세요. 기본적으로 예약된 용량을 사용할 수 있습니다.

예를 들어 요청된 용량을 다른 두 프로젝트와 공유하려면 다음을 포함합니다.
```
"shareSettings": {
  "shareType": "SPECIFIC_PROJECTS",
  "projectMap": {
    "CONSUMER_PROJECT_ID_1": {
      "projectId": "CONSUMER_PROJECT_ID_1"
    },
    "CONSUMER_PROJECT_ID_2": {
      "projectId": "CONSUMER_PROJECT_ID_2"
    }
  }
}
```
CONSUMER_PROJECT_ID_1 및 CONSUMER_PROJECT_ID_2를 요청된 용량을 사용할 수 있도록 허용할 두 프로젝트의 ID로 바꿉니다.
NUMBER_OF_VMS: 예약할 GPU VM 수입니다. 값은 1에서 80 사이여야 합니다.
MACHINE_TYPE: 예약할 GPU 머신 유형입니다. 다음 값 중 하나를 지정합니다.
- A4 머신 유형: a4-highgpu-8g
- A3 Ultra 머신 유형: a3-ultragpu-8g
NUMBER_OF_CHIPS: 예약할 TPU 칩 수로 바꿉니다. 값은 1, 4, 8, 16, 32, 64, 128, 256, 512 또는 1024이어야 합니다.
TPU_VERSION: 예약할 TPU 버전으로 바꿉니다. 다음 값 중 하나를 지정합니다.
- TPU v6e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E
- TPU v5p: VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P
- TPU v5e: VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
TPU v5e를 지정하는 경우 aggregateResources 필드에 workloadType 필드를 포함해야 합니다. TPU에서 실행할 워크로드 유형으로 필드를 설정합니다.
- ML 학습 워크로드와 같이 단일 또는 여러 작업에서 대량의 데이터를 처리하는 워크로드의 경우 BATCH를 지정합니다.
- ML 추론 워크로드와 같이 동시 요청을 처리하고 최소한의 네트워크 지연 시간이 필요한 워크로드의 경우에는 SERVING을 지정합니다.
  
  참고: SERVING을 지정하는 경우 TPU v5e 칩 1개, 4개 또는 8개만 예약할 수 있습니다.
START_TIME: 요청 시작 시간으로 바꿉니다. 형식은 RFC 3339 타임스탬프 형식입니다.
END_TIME: RFC 3339 타임스탬프 형식의 예약 기간의 종료 시간. 종료 시간 대신 예약 기간을 초 단위로 지정하려면 endTime 필드를 duration 필드로 대체합니다.

캘린더 모드에서 미래용 예약 요청 만들기

시작하기 전에

Console

gcloud

REST

필요한 역할

필수 권한

개요

리소스의 향후 가용성 보기

콘솔

gcloud

REST

GPU VM 또는 TPU 예약 요청 만들기

콘솔

gcloud

REST

다음 단계