Nesta página, você encontra uma visão geral do destino do BigQuery. Ele descreve o comportamento de gravação e as limitações conhecidas do Datastream ao replicar dados no BigQuery.
Comportamento de gravação
O tamanho máximo do evento ao transmitir dados para o BigQuery é de 20 MB.
Ao configurar seu stream, você pode selecionar a maneira como o Datastream grava os dados de mudança no BigQuery. Para mais informações, consulte Configurar o modo de gravação.
Metadados da tabela
O Datastream anexa uma coluna STRUCT
chamada datastream_metadata
a cada tabela gravada no destino do BigQuery.
Modo de gravação de mesclagem
Se uma tabela tiver uma chave primária na origem, a coluna vai conter os seguintes campos:
UUID
: esse campo tem o tipo de dadosSTRING
.SOURCE_TIMESTAMP
: esse campo tem o tipo de dadosINTEGER
.
Se uma tabela não tiver uma chave primária, a coluna vai conter um campo adicional: IS_DELETED
. Esse campo tem o tipo de dados BOOLEAN
e indica se os dados transmitidos pelo Datastream para o destino estão associados a uma operação DELETE
na origem. Tabelas sem chaves primárias são somente de anexação.
Modo de gravação somente anexar
A coluna datastream_metadata
contém os mesmos campos para tabelas com e sem chaves primárias:
UUID
: esse campo tem o tipo de dadosSTRING
.SOURCE_TIMESTAMP
: esse campo tem o tipo de dadosINTEGER
.CHANGE_SEQUENCE_NUMBER
: esse campo tem o tipo de dadosSTRING
. É um número de sequência interno usado pelo Datastream para cada evento de mudança.CHANGE_TYPE
: esse campo tem o tipo de dadosSTRING
. Indica o tipo de evento de mudança:INSERT
,UPDATE-INSERT
,UPDATE-DELETE
ouDELETE
.SORT_KEYS
: esse campo contém uma matriz de valoresSTRING
. Você pode usar os valores para classificar os eventos de mudança.
Controlar custos do BigQuery
Os custos do BigQuery são cobrados separadamente do Datastream. Para saber como controlar os custos do BigQuery, consulte Preços do CDC do BigQuery.
Limitações conhecidas
Limitações conhecidas para o uso do BigQuery como destino:
- Só é possível replicar dados em um conjunto de dados do BigQuery que esteja no mesmo projeto Google Cloud que o fluxo do Datastream.
- Por padrão, o Datastream não oferece suporte à adição de uma chave primária a uma tabela já replicada no BigQuery sem uma chave primária ou à remoção de uma chave primária de uma tabela replicada no BigQuery com uma chave primária. Se você precisar fazer essas mudanças, entre em contato com o suporte do Google. Para informações sobre como mudar a definição de chave primária de uma tabela de origem que já tem uma chave primária, consulte Diagnosticar problemas.
As chaves primárias no BigQuery precisam ser dos seguintes tipos de dados:
DATE
BOOL
GEOGRAPHY
INT64
NUMERIC
BIGNUMERIC
STRING
TIMESTAMP
DATETIME
As tabelas que contêm chaves primárias de tipos de dados sem suporte não são replicadas pelo Datastream.
O BigQuery não aceita nomes de tabelas com caracteres
.
,$
,/
,@
ou+
. O Datastream substitui esses caracteres por sublinhados ao criar tabelas de destino.Por exemplo,
table.name
no banco de dados de origem se tornatable_name
no BigQuery.Para mais informações sobre nomes de tabelas no BigQuery, consulte Nomenclatura de tabelas.
O BigQuery não aceita mais de quatro colunas de clusterização. Ao replicar uma tabela com mais de quatro colunas de chave primária, o Datastream usa quatro colunas de chave primária como colunas de clusterização.
O Datastream mapeia literais de data e hora fora do intervalo, como tipos de data infinita do PostgreSQL, para os seguintes valores:
- Positivo
DATE
para o valor de9999-12-31
- Negativo
DATE
para o valor de0001-01-01
- Positivo
TIMESTAMP
para o valor de9999-12-31 23:59:59.999000 UTC
- Negativo
TIMESTAMP
para o valor de0001-01-01 00:00:00 UTC
- Positivo
O BigQuery não oferece suporte a tabelas de streaming com chaves primárias dos tipos de dados
FLOAT
ouREAL
. Essas tabelas não são replicadas. Para saber mais sobre os tipos e intervalos de datas do BigQuery, consulte Tipos de dados.Se a origem for o Salesforce, a opção de configuração Conjunto de dados para cada esquema não será compatível.
A seguir
- Saiba como replicar dados de um banco de dados de origem para conjuntos de dados do BigQuery usando o Datastream.