Dataproc 定價

Dataproc on Compute Engine 定價

Compute Engine 適用的 Dataproc 定價是根據 Dataproc 叢集的大小和運作時間長度計算。叢集的大小是按照整個叢集 (包含主要節點和工作站節點) 中的虛擬 CPU (vCPU) 總數來計算,叢集的運作時間則為叢集建立後至停止或刪除這段期間的時間長度。

Dataproc 費用公式:$0.010 * # of vCPUs * hourly duration

儘管費用公式是以每小時費率來計算,Dataproc 仍是以秒計費。所有 Dataproc 叢集的費用均是以秒為單位累計,而且都會產生 1 分鐘的基本費用。為了將以秒計費的用量轉換為以小時為單位的計費方式,我們會以小數小時為單位來表示用量,例如 30 分鐘會以 0.5 小時表示。

Dataproc 的費用並未涵蓋在您為每部虛擬機器支付的每個 Compute Engine 執行個體費用中,相關說明請見使用其他 Google Cloud 資源

已累積費用

下列 Dataproc 作業和情境會產生費用:

  • 調度資源自動調度資源:新增 VM 至叢集後,系統會在 VM 運作期間逐漸累積費用。這些累積費用會持續計費,直到您移除 VM 為止。

  • 處於錯誤狀態的叢集:Dataproc 叢集處於錯誤狀態時,叢集 VM 仍會保持運作,費用也會持續累積。這些累積費用會持續計費,直到叢集刪除為止。

計費示例

假設有一個採用下列設定的叢集 (具備主要節點和工作站節點):

項目 機器類型 虛擬 CPU 數量 連接的永久磁碟大小 叢集中的數量
主要節點 n1-standard-4 4 500 GB 1
工作站節點 n1-standard-4 4 500 GB 5

這個 Dataproc 叢集含有 24 個虛擬 CPU,其中 4 個用於主要節點,其餘 20 個則散布於各個工作站。系統會依據這 24 個虛擬 CPU 和叢集運作時間長度,計算這個叢集的 Dataproc 費用 (假設節點資源均未調降,也沒有先占節點)。如果叢集的運作時間為 2 個小時,則 Dataproc 採用的計費公式如下:

Dataproc charge = # of vCPUs * hours * Dataproc price = 24 * 2 * $0.01 = $0.48

在這個示例中,除了 Dataproc 費用之外,這個叢集也使用了 Compute Engine 和標準永久磁碟儲存空間,因此您必須一併支付這兩項元件的費用 (相關說明請見使用其他 Google Cloud 資源)。您可以使用費用計算工具來試算個別 Google Cloud 資源的費用。

使用其他 Google Cloud 資源

以其他 Google Cloud 技術為基礎的 Dataproc 是一套可提供全代管的整合式解決方案。Dataproc 叢集會使用多種資源,系統會分別依據各項資源的計費方式向您收費,這類資源包括:

Dataproc 叢集可選擇使用下列資源,系統會分別依據各項資源的計費方式向您收費,這類資源包括但不限於:

Dataproc on GKE 定價

本節說明僅適用於在使用者自行管理的 GKE 上執行的虛擬 Dataproc 叢集的費用。如要瞭解適用於使用者自行管理的 GKE 叢集的額外費用,請參閱 GKE 定價

GKE 適用的 Dataproc 定價公式 ($0.010 * # of vCPUs * hourly duration) 與 Compute Engine 適用的 Dataproc 定價公式相同,適用於叢集中 Dataproc 建立的節點集區中,在 VM 執行個體中運作的虛擬 CPU 總數。虛擬機器執行個體的執行時間是指從建立到刪除之間的時間長度。與 Compute Engine 上的 Dataproc 一樣,GKE 上的 Dataproc 是以秒計費,每個虛擬機器執行個體的最低計費時間為 1 分鐘。除了 Dataproc 費用之外,還會收取其他 Google Cloud 費用

由 Dataproc 建立的節點集區可能會由多個叢集共用,因此在刪除 Dataproc 叢集後仍會存在。如果您刪除節點集區縮減節點集區至零個執行個體,就不會繼續產生 Dataproc 費用。如果您保留了任何節點集區 VM,系統會繼續向您收取費用,直到您刪除這些 VM 為止。

無伺服器型 Dataproc 定價

請參閱「Dataproc Serverless 定價」一文。

後續步驟

索取客製化報價

Google Cloud 提供「即付即用」計費模式,您只需要為所用服務付費。貴機構如需索取客製化的報價,請與我們的銷售團隊聯絡。
聯絡銷售人員