Dataproc 가격 책정
Compute Engine 기반 Dataproc 가격 책정
Compute Engine 기반 Dataproc 가격은 Dataproc 클러스터의 크기와 실행 기간에 따라 책정됩니다. 클러스터 크기는 마스터 및 워커 노드를 포함한 전체 클러스터의 총 가상 CPU (vCPU) 수를 기준으로 결정됩니다. 클러스터의 기간은 클러스터가 생성되어 중지되거나 삭제되기까지의 시간입니다.
Dataproc 가격 책정 공식은 $0.010 * # of vCPUs * hourly duration
입니다.
가격 책정 공식에서는 시간 단위 요금을 사용하지만 Dataproc 요금은 초 단위로 청구되어 모든 Dataproc 클러스터는 1초 단위로 요금이 부과되며 최소 요금은 1분부터 시작됩니다. 초당 사용량에 시간당 요금을 적용하기 위해 사용량은 시간 단위(예: 30분은 0.5시간으로 표시)로 표기됩니다.
Dataproc 가격은 각 가상 머신의 Compute Engine 인스턴스당 가격에 추가로 부과됩니다(기타 Google Cloud 리소스 사용 참조).
발생한 비용
다음 Dataproc 작업과 시나리오에서는 요금이 부과됩니다.
확장 및 자동 확장: VM이 클러스터에 추가되면 VM이 활성 상태일 때 비용이 부과됩니다. 이러한 누적 요금은 VM이 삭제될 때까지 계속 청구됩니다.
오류 상태의 클러스터: Dataproc 클러스터가 오류 상태에 있으면 클러스터 VM이 활성 상태로 유지되고 요금이 계속 발생합니다. 이러한 누적 요금은 클러스터가 삭제될 때까지 계속 청구됩니다.
가격 책정 예시
예를 들어 다음과 같은 구성의 클러스터(마스터 및 워커 노드 사용)가 있다고 가정해 보겠습니다.
항목 | 머신 유형 | 가상 CPU | 연결된 영구 디스크 | 클러스터 번호 |
---|---|---|---|---|
마스터 노드 | n1-standard-4 | 4 | 500GB | 1 |
워커 노드 | n1-standard-4 | 4 | 500GB | 5 |
이 Dataproc 클러스터에는 24개의 가상 CPU가 있습니다(마스터용으로 4개, 작업자 전반에 분산된 20개). Dataproc 청구를 위해 이 클러스터는 24개의 가상 CPU와 클러스터가 실행된 기간을 기준으로 가격이 책정됩니다(축소되거나 선점된 노드는 없다고 가정). 클러스터가 2시간 동안 실행되는 경우 Dataproc 가격에 적용되는 공식은 다음과 같습니다.
Dataproc charge = # of vCPUs * hours * Dataproc price = 24 * 2 * $0.01 = $0.48
이 예시에서는 Dataproc 요금 외에 클러스터에서 Compute Engine 및 표준 영구 디스크 프로비저닝 공간에 대한 요금도 발생합니다(기타 Google Cloud 리소스 사용 참조). 청구 계산기를 사용하면 각 Google Cloud 리소스 비용을 따로 확인할 수 있습니다.
기타 Google Cloud 리소스 사용
Dataproc은 관리형 통합 솔루션으로서 다른 Google Cloud 기술을 바탕으로 구축되었습니다. Dataproc 클러스터는 다음과 같은 리소스를 사용하며 각기 해당하는 가격에 따라 요금이 청구됩니다.
- Compute Engine - Dataproc 클러스터의 모든 Compute Engine 인스턴스는 최소 요금이 1분부터 시작되고 1초 단위로 요금이 부과되며 지속 사용 가격 규칙이 적용됩니다.
- 표준 영구 디스크 프로비저닝된 공간
- Cloud Monitoring: Google Cloud Observability 가격 책정 참조
원하는 경우 Dataproc 클러스터에서 다음을 포함한 여러 리소스를 활용할 수 있으며 각기 해당하는 가격에 따라 요금이 청구됩니다.
GKE 기반 Dataproc 가격 책정
이 섹션에서는 사용자 관리형 GKE에서 실행되는 가상 Dataproc 클러스터에만 적용되는 요금을 설명합니다. 사용자 관리형 GKE 클러스터에 적용되는 추가 요금에 대해 알아보려면 GKE 가격 책정을 참조하세요.
GKE 기반 Dataproc 가격 책정 공식
$0.010 * # of vCPUs * hourly duration
은 Compute Engine 기반 Dataproc 가격 책정 공식과 동일하며 클러스터의 Dataproc이 만든 노드 풀에서 VM 인스턴스에서 실행되는 가상 CPU의 총 개수에 적용됩니다. 가상 머신 인스턴스의 기간은 생성부터 삭제까지의
시간입니다. Compute Engine의 Dataproc과 마찬가지로
GKE의 Dataproc도 가상 머신 인스턴스당 최소 1분의
청구 기준에 따라 초 단위로 청구됩니다. 다른 Google Cloud 요금
이 Dataproc 요금에 추가로 적용됩니다.
Dataproc에서 만든 노드 풀은 여러 클러스터에서 공유될 수 있으므로 Dataproc 클러스터를 삭제한 후에도 계속 존재합니다. 노드 풀을 삭제하거나 노드 풀을 0개 인스턴스로 축소하면 Dataproc 요금이 계속 청구되지 않습니다. 남아 있는 노드 풀 VM은 삭제할 때까지 계속 요금이 부과됩니다.
Dataproc Serverless 가격 책정
Dataproc 서버리스 가격 책정을 참조하세요.
다음 단계
- Dataproc 문서 읽어보기
- Dataproc 시작하기
- 가격 계산기 사용해 보기
- Dataproc 솔루션 및 사용 사례 알아보기