建立啟用變更串流的表格並擷取變更
瞭解如何設定啟用變更串流的 Bigtable 資料表、執行變更串流管道、變更資料表,然後查看串流的變更。
事前準備
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Dataflow, Cloud Bigtable API, and Cloud Bigtable Admin API APIs.
-
In the Google Cloud console, activate Cloud Shell.
建立啟用變更串流的資料表
前往 Google Cloud 控制台的 Bigtable「Instances」(執行個體) 頁面。
按一下您要在本快速入門導覽課程使用的執行個體 ID。
如果沒有可用的執行個體,請在您附近的區域建立執行個體,並使用預設設定。
按一下左側導覽窗格中的「表格」。
按一下「建立資料表」。
將資料表命名為
change-streams-quickstart
。新增名為
cf
的資料欄系列。選取「啟用變更串流」。
點選「建立」。
初始化資料管道,擷取變更串流
在 Cloud Shell 中執行下列指令,下載並執行程式碼。
git clone https://github.com/GoogleCloudPlatform/java-docs-samples.git cd java-docs-samples/bigtable/beam/change-streams mvn compile exec:java -Dexec.mainClass=ChangeStreamsHelloWorld \ "-Dexec.args=--project=PROJECT_ID --bigtableProjectId=PROJECT_ID \ --bigtableInstanceId=BIGTABLE_INSTANCE_ID --bigtableTableId=change-streams-quickstart \ --runner=dataflow --region=BIGTABLE_REGION --experiments=use_runner_v2"
更改下列內容:
- PROJECT_ID:您使用的專案 ID
- BIGTABLE_INSTANCE_ID:要包含新資料表的執行個體 ID
- BIGTABLE_REGION:Bigtable 執行個體所在的區域,例如
us-east5
前往 Google Cloud 控制台的「Dataflow」頁面。
按一下名稱開頭為「changestreamquickstart」changestreamquickstart的工作。
按一下畫面底部的「顯示」,開啟記錄面板。
按一下「工作人員記錄」,即可監控變更串流的輸出內容。
在 Cloud Shell 中,將一些資料寫入 Bigtable,查看變更串流處理程序。
cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ import change-streams-quickstart quickstart-data.csv column-family=cf
在 Google Cloud 控制台中,確認「嚴重程度」至少設為
Info
。工作站記錄檔輸出內容包含以下項目:
Change captured: user123#2023,USER,SetCell,cf,col1,abc Change captured: user546#2023,USER,SetCell,cf,col1,def Change captured: user789#2023,USER,SetCell,cf,col1,ghi
清除所用資源
如要避免系統向您的 Google Cloud 帳戶收取本頁所用資源的費用,請按照下列步驟操作。
停用資料表的變更串流
gcloud bigtable instances tables update change-streams-quickstart --instance=BIGTABLE_INSTANCE_ID \ --clear-change-stream-retention-period
刪除資料表
change-streams-quickstart
:cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID deletetable change-streams-quickstart
停止變更串流管道:
前往 Google Cloud 控制台的 Dataflow「Jobs」(工作) 頁面。
從工作清單中選取串流工作。
按一下導覽區中的「停止」。
在「停止工作」對話方塊中取消管道,然後按一下「停止工作」。
選用:如果您為本快速入門導覽課程建立了新的執行個體,請刪除該執行個體:
cbt deleteinstance BIGTABLE_INSTANCE_ID