Criar uma tabela de alterações ativada por stream e capturar alterações
Saiba como configurar uma tabela do Bigtable com um fluxo de alterações ativado, executar um pipeline de fluxo de alterações, fazer alterações na tabela e conferir as mudanças transmitidas.
Antes de começar
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Dataflow, Cloud Bigtable API, and Cloud Bigtable Admin API APIs.
-
In the Google Cloud console, activate Cloud Shell.
Criar uma tabela com um fluxo de alterações ativado
No Console do Google Cloud, acesse a página Instâncias do Bigtable.
Clique no código da instância que você está usando para este guia de início rápido.
Se você não tiver uma instância disponível, crie uma com as configurações padrão em uma região perto de você.
No painel de navegação à esquerda, clique em Tabelas.
Clique em Criar uma tabela.
Nomeie a tabela como
change-streams-quickstart
.Adicione um grupo de colunas chamado
cf
.Selecione Ativar fluxo de alterações.
Clique em Criar.
Inicializar um pipeline de dados para capturar o fluxo de alterações
No Cloud Shell, execute os seguintes comandos para fazer o download do código e executá-lo.
git clone https://github.com/GoogleCloudPlatform/java-docs-samples.git cd java-docs-samples/bigtable/beam/change-streams mvn compile exec:java -Dexec.mainClass=ChangeStreamsHelloWorld \ "-Dexec.args=--project=PROJECT_ID --bigtableProjectId=PROJECT_ID \ --bigtableInstanceId=BIGTABLE_INSTANCE_ID --bigtableTableId=change-streams-quickstart \ --runner=dataflow --region=BIGTABLE_REGION --experiments=use_runner_v2"
Substitua:
- PROJECT_ID: o ID do projeto que você está usando.
- BIGTABLE_INSTANCE_ID: o ID da instância para conter a nova tabela.
- BIGTABLE_REGION: a região em que a instância do Bigtable está, como
us-east5
No Console do Google Cloud, abra a página Dataflow.
Clique no job com um nome que começa com changestreamquickstart.
Na parte inferior da tela, clique em Mostrar para abrir o painel de registros.
Clique em Registros do worker para monitorar a saída do fluxo de alterações.
No Cloud Shell, grave alguns dados no Bigtable para ver o processo de stream de alteração.
cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID \ import change-streams-quickstart quickstart-data.csv column-family=cf
No console do Google Cloud, verifique se a Gravidade está definida como pelo menos
Info
.Os registros de saída do registro do worker contêm o seguinte:
Change captured: user123#2023,USER,SetCell,cf,col1,abc Change captured: user546#2023,USER,SetCell,cf,col1,def Change captured: user789#2023,USER,SetCell,cf,col1,ghi
Limpeza
Para evitar cobranças na conta do Google Cloud pelos recursos usados nesta página, siga estas etapas.
Desativar o fluxo de alterações na tabela
gcloud bigtable instances tables update change-streams-quickstart --instance=BIGTABLE_INSTANCE_ID \ --clear-change-stream-retention-period
Excluir a tabela
change-streams-quickstart
:cbt -instance=BIGTABLE_INSTANCE_ID -project=PROJECT_ID deletetable change-streams-quickstart
Pare o pipeline de stream de alteração:
No console do Google Cloud, acesse a página Jobs do Dataflow.
Selecione o job de streaming na lista de jobs.
Na navegação, clique em Parar.
Na caixa de diálogo Interromper job, cancele o pipeline e clique em Interromper job.
Opcional: exclua a instância se você criou uma nova para este guia de início rápido:
cbt deleteinstance BIGTABLE_INSTANCE_ID