Preparar dados com o Gemini
Neste documento, descrevemos como gerar e gerenciar sugestões de código SQL para suas preparações de dados no BigQuery.
Para mais informações, consulte Introdução ao preparo de dados do BigQuery.
Antes de começar
Abrir o editor de preparação de dados no BigQuery
Para abrir o editor de preparação de dados no BigQuery, crie uma preparação de dados, crie uma com base em uma tabela ou abra uma preparação de dados. Para mais informações sobre o que acontece ao criar uma preparação de dados, consulte Pontos de entrada da preparação de dados.
Na página do BigQuery, é possível acessar o editor de preparação de dados das seguintes maneiras:
Criar novo
Para criar uma nova preparação de dados no BigQuery, siga estas etapas:
- No console Google Cloud , acesse a página BigQuery.
Acessar o BigQuery - Acesse a lista Criar novo e clique em Preparação de dados. O editor de preparação de dados vai aparecer em uma nova guia sem título.
- Na barra de pesquisa do editor, insira o nome da tabela ou palavras-chave e selecione uma tabela. O editor de preparação de dados da tabela é aberto, mostrando uma prévia dos seus dados na guia Dados e um conjunto inicial de sugestões de preparação de dados do Gemini.
Um recurso de preparação de dados aparece no painel Explorador, onde você pode acessar essa preparação no futuro. - Opcional: para simplificar a visualização, ative o modo de tela cheia clicando em tela cheia Tela cheia.
Criar com base em uma tabela
Para criar uma nova preparação de dados com base em uma tabela, siga estas etapas:
- No console Google Cloud , acesse a página BigQuery.
Acessar o BigQuery - No painel Explorer, mantenha o ponteiro sobre uma tabela.
- Clique em more_vert
Menu > Consultar em > Preparação de dados. O editor de preparação de dados da tabela é aberto, mostrando uma prévia dos seus dados na guia Dados e um conjunto inicial de sugestões de preparação de dados do Gemini.
Um recurso de preparação de dados aparece no painel Explorador, onde você pode acessar essa preparação no futuro. - Opcional: para simplificar a visualização, ative o modo de tela cheia clicando em tela cheia Tela cheia.
Abrir mapa atual
Para abrir o editor de uma preparação de dados, siga estas etapas:
- No console Google Cloud , acesse a página BigQuery.
Acessar o BigQuery - No painel Explorer, clique no nome do projeto e em preparação de dados.
- Selecione o preparo de dados atual. A visualização em gráfico do pipeline de preparação de dados é mostrada.
- Selecione um dos nós no gráfico. O editor de preparação de dados da tabela é aberto, mostrando uma prévia dos seus dados na guia Dados e um conjunto inicial de sugestões de preparação de dados do Gemini.
- Opcional: para simplificar a visualização, ative o modo de tela cheia clicando em tela cheia Tela cheia.
Adicionar etapas de preparação de dados
Você prepara os dados em etapas. É possível visualizar ou aplicar as etapas sugeridas pelo Gemini. Você também pode melhorar as sugestões ou aplicar suas próprias etapas.
Aplicar e melhorar as sugestões do Gemini
Quando você abre o editor de preparação de dados da sua tabela, o Gemini inspeciona os dados e o esquema da tabela carregada e gera sugestões de filtro e transformação. As sugestões aparecem em cards na lista Etapas.
A imagem a seguir mostra onde você pode aplicar e melhorar as etapas sugeridas pelo Gemini:
Para aplicar uma sugestão do Gemini como uma etapa de preparação de dados, faça o seguinte:
- Na visualização de dados, clique no nome de uma coluna ou em uma célula específica. O Gemini gera sugestões para filtrar e transformar os dados.
Opcional: para melhorar as sugestões, edite os valores de uma a três células na tabela para demonstrar como os valores em uma coluna devem aparecer. Por exemplo, insira uma data da maneira como você quer formatar todas as datas. O Gemini gera novas sugestões com base nas suas mudanças.
A imagem a seguir mostra como editar valores para melhorar as etapas sugeridas pelo Gemini:
Selecione um cartão de sugestão.
- Opcional: para visualizar o resultado do card de sugestão, clique em Visualizar.
- Opcional: para modificar o card de sugestão usando linguagem natural, clique em Editar.
Clique em Aplicar.
Adicionar etapas com linguagem natural ou expressões SQL
Se as sugestões atuais não atenderem às suas necessidades, adicione uma etapa. Escolha colunas ou um tipo de etapa e descreva o que você quer usando linguagem natural.
Adicionar uma transformação
- Na visualização de dados ou de esquema, escolha a opção Transformar. Você também pode escolher colunas ou adicionar exemplos para ajudar o Gemini a entender sua transformação de dados.
- No campo Descrição, insira um comando, como
Convert the state column to uppercase
. Clique em enviar Enviar.
O Gemini gera uma expressão SQL e uma nova descrição com base no seu comando.
Na lista Coluna de destino, selecione ou insira um nome de coluna.
Opcional: para atualizar a expressão SQL, revise o comando e clique em send Enviar ou insira uma expressão SQL manualmente.
Opcional: clique em Visualizar e revise a etapa.
Clique em Aplicar.
Nivelar colunas JSON
É possível simplificar os dados JSON de uma fonte durante a preparação de dados. Esse processo, chamado de nivelamento, extrai todos os pares de chave-valor das colunas JSON de uma só vez e os transforma em colunas próprias na tabela. Isso ajuda quando você precisa facilitar a análise de estruturas JSON complexas ou combiná-las com outros dados.
O Gemini para BigQuery sugere operações que extraem campos apenas do nível superior do JSON. Se esses campos extraídos contiverem mais objetos JSON, você poderá nivelá-los em etapas adicionais para acessar o conteúdo.
- Na visualização de dados de uma tabela de origem JSON, escolha uma coluna ou células.
- Clique em Flatten para gerar sugestões.
- Opcional: para atualizar a expressão SQL, insira uma expressão SQL manualmente.
- Opcional: clique em Visualizar e revise a etapa.
- Clique em Aplicar.
O achatamento tem os seguintes comportamentos:
- A opção Flatten aparece na visualização de dados depois que você seleciona células ou colunas que contêm JSON. Ele não aparece por padrão quando você clica em Adicionar etapa.
- Se uma chave JSON não estiver presente nas linhas selecionadas, a sugestão gerada não vai conter essa chave. Esse problema pode fazer com que algumas colunas sejam omitidas quando os dados são simplificados.
- Se os nomes de coluna entrarem em conflito durante o nivelamento, os nomes repetidos vão terminar neste formato:
_<i>
. Por exemplo, se já houver uma coluna chamadaaddress
, o novo nome da coluna simplificada seráaddress_1
. - Os nomes de colunas simplificados seguem as convenções de nomenclatura de colunas do BigQuery.
- Se você deixar o campo da chave JSON vazio, o formato padrão do nome da coluna será
f<i>_
.
Filtrar linhas
Para adicionar um filtro que remove linhas, siga estas etapas:
- Na visualização de dados ou de esquema, escolha a opção Filtrar. Você também pode escolher colunas para ajudar o Gemini a entender seu filtro de dados.
- No campo Descrição, insira um comando, como
Column ID should not be NULL
. - Clique em Gerar. O Gemini gera uma expressão SQL e uma nova descrição com base no seu comando.
- Opcional: para atualizar a expressão SQL, revise o comando e clique em send Enviar ou insira uma expressão SQL manualmente.
- Opcional: clique em Visualizar e revise a etapa.
- Clique em Aplicar.
Formato da expressão de filtro
As expressões SQL para filtros retêm as linhas que correspondem à condição especificada. Isso
é equivalente a uma instrução SELECT … WHERE SQL_EXPRESSION
.
Por exemplo, para reter registros em que a coluna year
é maior ou igual a 2000
, a condição é year >= 2000
.
As expressões precisam seguir a sintaxe SQL do BigQuery para a cláusula WHERE
.
Configurar a tabela de erros e adicionar uma regra de validação
É possível adicionar um filtro que cria uma regra de validação, que envia erros para uma tabela de erros ou falha na execução da preparação de dados.
Configurar a tabela de erros
Para configurar sua tabela de erros, siga estas etapas:
- No editor de preparação de dados, acesse a barra de ferramentas e clique em Mais > Tabela de erros.
- Clique em Ativar tabela de erros.
- Defina o local da tabela.
- Opcional: defina uma duração máxima para manter os erros.
- Clique em Salvar.
Adicionar uma regra de validação
Para adicionar uma regra de validação, siga estas etapas:
- Na visualização de dados ou de esquema, clique na opção Filtrar. Você também pode escolher colunas para ajudar o Gemini a entender seu filtro de dados.
- Insira uma descrição para a etapa.
- Insira uma expressão SQL na forma de uma cláusula
WHERE
. - Opcional: se você quiser que a expressão SQL funcione como uma regra de validação, marque a caixa de seleção As linhas de validação com falhas vão para a tabela de erros. Você também pode mudar um filtro para uma validação na barra de ferramentas de preparação de dados clicando em Mais > Tabela de erros.
- Opcional: clique em Visualizar e revise a etapa.
- Clique em Aplicar.
Excluir uma coluna
Para excluir uma ou mais colunas de uma preparação de dados, siga estas etapas:
- Na visualização de dados ou esquema, selecione as colunas que você quer descartar.
- Clique em Abandonar. Uma nova etapa aplicada é adicionada para as colunas excluídas.
Adicionar uma operação de junção com o Gemini
Para adicionar uma etapa de operação de junção entre duas fontes na preparação de dados, siga estas etapas:
- Na visualização de dados de um nó na preparação de dados, acesse a lista Sugestões e clique na opção Junção.
- Na caixa de diálogo Adicionar junção, clique em Procurar e selecione a outra tabela envolvida na operação de junção (referida como o lado direito da junção).
- Opcional: selecione o tipo de operação de junção que você quer realizar, como Junção interna.
Revise as informações da chave de junção geradas pelo Gemini nos seguintes campos:
- Descrição da junção: a descrição em linguagem natural da expressão SQL para a operação de junção. Quando você edita essa descrição e clica em enviar Enviar, o Gemini sugere novas condições de junção SQL.
Condições de junção: as expressões SQL na cláusula
ON
para a operação de junção. Você pode usar os qualificadoresL
eR
para se referir às tabelas de origem à esquerda e à direita, respectivamente. Por exemplo, para mesclar a colunacustomer_id
da tabela à esquerda com a colunacustomer_id
da tabela à direita, insiraL.customerId = R.customerId
. Esses qualificadores não diferenciam maiúsculas de minúsculas.
Opcional: para refinar as sugestões do Gemini, edite o campo Descrição da participação e clique em enviar Enviar.
Opcional: para visualizar as configurações da operação de junção do preparo de dados, clique em Visualizar.
Clique em Aplicar.
A etapa de operação de junção é criada. A tabela de origem selecionada (o lado direito da junção) e a operação de junção são refletidas na lista de etapas aplicadas e nos nós na visualização de gráfico do preparo de dados.
Adicionar ou mudar uma tabela de destino
Para adicionar ou mudar uma tabela de destino para a saída da preparação de dados, siga estas etapas:
- Na visualização de dados ou de esquema, escolha a opção Destino.
- Selecione o projeto em que a tabela de destino está armazenada.
- Selecione um dos conjuntos de dados ou carregue um novo.
- Insira uma tabela de destino. Se a tabela não existir, a preparação de dados vai criar uma nova na primeira execução. Para mais informações, consulte Modo de gravação.
- Selecione seu conjunto de dados como o conjunto de dados de destino.
- Clique em Salvar.
Conferir a amostra de dados e o esquema de uma etapa aplicada
Para conferir detalhes de amostra e esquema em uma etapa específica da preparação de dados, faça o seguinte:
- No editor de preparação de dados, acesse a lista Etapas e clique em Etapas aplicadas.
- Selecione uma etapa. As guias Dados e Esquema aparecem, mostrando a amostra de dados e o esquema desta etapa específica.
Editar uma etapa aplicada
Para editar uma etapa aplicada, faça o seguinte:
- No editor de preparação de dados, acesse a lista Etapas e clique em Etapas aplicadas.
- Selecione uma etapa.
- Ao lado da etapa, clique em more_vert Menu > Editar.
- Na caixa de diálogo Editar etapa aplicada, você pode fazer o seguinte:
- Edite a descrição da etapa.
- Para receber sugestões do Gemini, edite a descrição e clique em enviar Enviar.
- Edite a expressão SQL.
- No campo Coluna de destino, selecione uma coluna.
- Opcional: clique em Visualizar e revise a etapa.
- Clique em Aplicar.
Excluir uma etapa aplicada
Para excluir uma etapa aplicada, faça o seguinte:
- No editor de preparação de dados, acesse a lista Etapas e clique em Etapas aplicadas.
- Selecione uma etapa.
- Clique em more_vert Menu > Excluir.
Executar a preparação de dados
Depois de adicionar as etapas de preparação de dados, configurar o destino e corrigir os erros de validação, é possível fazer testes em uma amostra dos dados ou implantar as etapas e programar execuções de preparação de dados. Para mais informações, consulte Programar preparações de dados.
Atualizar exemplos de preparação de dados
Os dados na amostra não são atualizados automaticamente. Se os dados nas tabelas de origem para o preparo de dados tiverem mudado, mas as mudanças não forem refletidas na amostra de dados do preparo, clique em Mais > Atualizar amostra.
A seguir
- Saiba como programar preparações de dados.
- Saiba mais sobre como gerenciar preparações de dados.
- Saiba mais sobre as cotas e os limites do Gemini no BigQuery.
- Confira os preços do Gemini no BigQuery.