Dataproc 選用 Zeppelin 元件

當您使用選用元件功能建立 Dataproc 叢集時,可以安裝 Zeppelin 等其他元件。本頁面提供 Zeppelin 元件的說明。

Zeppelin Notebook 是用於進行互動資料分析的網頁式筆記本。Zeppelin 網頁版 UI 位於叢集的第一個主要節點的 8080 通訊埠上。

根據預設,筆記本會儲存在 Cloud Storage 中,即由使用者指定或系統自動建立的 Dataproc 暫存值區。此位置可在叢集建立時透過 zeppelin:zeppelin.notebook.gcs.dir 屬性變更。

安裝元件

請在建立 Dataproc 叢集時安裝元件。您可以將元件新增至使用 Dataproc 1.3 版和更新版本建立的叢集。

請參閱支援的 Dataproc 版本,瞭解每個 Dataproc 映像檔版本中包含的元件版本。

gcloud 指令

如要建立包含 Zeppelin 元件的 Dataproc 叢集,請使用 gcloud dataproc clusters create cluster-name 指令搭配 --optional-components 標記。

gcloud dataproc clusters create cluster-name \
    --optional-components=ZEPPELIN \
    --region=region \
    --enable-component-gateway \
    ... other flags

REST API

您可以透過 Dataproc API,使用 SoftwareConfig.Component 做為 clusters.create 要求的一部分,指定 Zeppelin 元件。

控制台

  1. 啟用元件和元件閘道。
    • 在 Google Cloud 控制台中,開啟 Dataproc 的「Create a cluster」(建立叢集) 頁面。已選取「設定叢集」面板。
    • 在「元件」部分:
      • 在「選用元件」下方,選取要安裝在叢集上的 Zeppelin 和其他選用元件。
      • 在「元件閘道」下方,選取「啟用元件閘道」(請參閱「查看及存取元件閘道網址」)。

開啟 Zeppelin 筆記本

如要在本機瀏覽器中開啟在叢集主要節點上執行的 Zeppelin 筆記本 UI,請參閱「查看及存取元件閘道網址」一文,點選主控台上的「元件閘道」連結。 Google Cloud