Regions

Google Cloud에서는 여러 영역으로 하위 분할된 리전을 사용하여 실제 컴퓨팅 리소스의 지리적 위치를 정의합니다. AI Platform Prediction에서 작업을 실행하는 경우 작업을 실행할 리전을 지정합니다.

일반적으로 물리적 위치에서 가장 가까운 리전이나 의도한 사용자의 물리적 위치를 사용해야 하지만, 아래에 열거된 서비스별 이용 가능한 리전을 확인해 보세요.

사용 가능한 리전

AI Platform 예측은 다음 리전에서 사용할 수 있습니다.

미주

리전 오리건
us-west1
로스앤젤레스
us-west2
솔트레이크시티
us-west3
아이오와
us-central1
사우스캐롤라이나
us-east1
북 버지니아
us-east4
몬트리올
northamerica-northeast1
상파울루
southamerica-east1
온라인 예측(기존 MLS1 머신 유형)
온라인 예측(N1 머신 유형)
일괄 예측 * * * * *

유럽

리전 런던
europe-west2
벨기에
europe-west1
네덜란드
europe-west4
취리히
europe-west6
프랑크푸르트
europe-west3
핀란드
europe-north1
온라인 예측(기존 MLS1 머신 유형)
온라인 예측(N1 머신 유형)
일괄 예측 * * * * *

아시아 태평양

리전 뭄바이
asia-south1
싱가포르
asia-southeast1
홍콩
asia-east2
타이완
asia-east1
도쿄
asia-northeast1
오사카
asia-northeast2
시드니
australia-southeast1
서울
asia-northeast3
온라인 예측(기존 MLS1 머신 유형)
온라인 예측(N1 머신 유형)
일괄 예측 * * * * * * *

Google Cloud는 AI Platform Prediction 이외의 제품에도 추가 리전을 제공합니다.

리전 고려사항

리소스 부족

us-central1 리전에서는 GPU와 컴퓨팅 리소스의 수요가 높습니다. 작업 로그에 'Resources are insufficient in region: <region>. Please try a different region.'이라는 오류 메시지가 나타날 수 있습니다.

이 문제를 해결하려면 다른 리전을 사용하거나 나중에 다시 시도하세요.

Cloud Storage

  • AI Platform Prediction 작업은 해당 작업 데이터를 읽고 쓰는 데 사용하는 Cloud Storage 버킷과 같은 리전에서 실행되어야 합니다.

  • AI Platform Prediction 작업에 데이터를 읽고 쓰는 데 사용하는 모든 Cloud Storage 버킷에는 표준 스토리지 클래스를 사용해야 합니다.

온라인 예측

온라인 예측에 GPU 사용

온라인 예측용 GPU 사용은 리전 엔드포인트의 특정 리전에서만 사용할 수 있습니다. 전역 엔드포인트에서 GPU를 사용할 수 없습니다. 다음 표에는 각 리전 엔드포인트에서 온라인 예측에 사용할 수 있는 모든 가속기가 나와 있습니다.

미주

리전 오리건
us-west1
아이오와
us-central1
사우스캐롤라이나
us-east1
북 버지니아
us-east4
몬트리올
northamerica-northeast1
NVIDIA Tesla P4
NVIDIA Tesla P100
NVIDIA Tesla T4
NVIDIA Tesla V100

유럽

리전 런던
europe-west2
벨기에
europe-west1
네덜란드
europe-west4
프랑크푸르트
europe-west3
NVIDIA Tesla P4
NVIDIA Tesla P100
NVIDIA Tesla T4
NVIDIA Tesla V100

아시아 태평양

리전 싱가포르
asia-southeast1
타이완
asia-east1
도쿄
asia-northeast1
시드니
australia-southeast1
NVIDIA Tesla P4
NVIDIA Tesla P100
NVIDIA Tesla T4
NVIDIA Tesla V100

일괄 예측

  • 일괄 예측을 수행하려면 리전별 엔드포인트가 아닌 전역 API 엔드포인트를 사용해야 합니다.

  • 일괄 예측을 위한 모델 및 모델 버전은 다음 리전에만 배포할 수 있습니다.

    • us-central1
    • us-east1
    • us-east4
    • europe-west1
    • asia-northeast1

    사용 가능한 리전 표에 별표로 표시된 다른 사용 가능한 리전에서 일괄 예측을 수행하려면 Cloud Storage에 저장된 TensorFlow 저장된 모델을 사용해야 합니다.

  • 일괄 예측에서 최상의 성능을 얻기 위해서는 특히 매우 대규모 데이터 세트의 경우 같은 리전에서 예측 작업을 실행하고 입력 및 출력 데이터를 저장해야 합니다

  • 일괄 예측을 위해 모델 배포 시 예측을 실행할 리전을 지정합니다. 일괄 예측 작업을 시작할 때 기본 리전을 재정의해 작업을 실행할 리전을 지정할 수 있습니다.

리소스 위치 제한

조직 정책 관리자는 리소스 위치 제약조건을 만들어 모델 및 일괄 예측 작업에 사용 가능한 리전을 제한할 수 있습니다. 리소스 위치 제약조건이 AI Platform Prediction에 적용되는 방법에 대해 읽어보세요.