Gerenciar recursos de dados em um lake

Nesta página, explicamos como adicionar, atualizar e remover buckets do Cloud Storage e Conjuntos de dados do BigQuery como recursos nas zonas atuais do Dataplex.

Visão geral

Um recurso é mapeado para dados armazenados no Cloud Storage ou no BigQuery. Você mapear dados armazenados em projetos separados do Google Cloud como recursos em um único em um lake. É possível anexar buckets do Cloud Storage ou Conjuntos de dados do BigQuery gerenciados dentro do lake.

Antes de começar

  • Crie um lake e uma zona nele, se ainda não tiver feito isso.

  • A maioria dos comandos gcloud lakes requer um local. É possível especificar o local usando a sinalização --location.

Controle de acesso

  • Para remover recursos, conceda os papéis do IAM que contêm as permissões dataplex.lakes.delete, dataplex.zones.delete ou dataplex.assets.delete permissões do IAM. O Dataplex papéis específicos roles/dataplex.admin e roles/dataplex.editor pode ser usada para conceder essas permissões.

  • Para adicionar recursos, conceda os papéis do IAM que contêm as permissões create - dataplex.lakes.create, dataplex.zones.create ou dataplex.assets.create. Os papéis roles/dataplex.admin e roles/dataplex.editor contêm estas permissões.

  • Também é possível conceder permissões a usuários ou grupos com o roles/owner. e roles/editor papéis legados.

  • Você precisa autorizar o serviço do Dataplex nos recursos que anexada ao data lake do Dataplex. A autorização é automática concedido implicitamente para recursos no projeto em que o lake é criado. Para outros projetos, autorize o serviço Dataplex nos recursos explicitamente.

Para mais informações, consulte IAM e controle de acesso do Dataplex.

Conceder papéis para buckets do Cloud Storage

Para anexar um bucket do Cloud Storage de outro projeto ao data lake, precisa conceder à conta de serviço do Dataplex (service-PROJECT_NUMBER@gcp-sa-dataplex.iam.gserviceaccount.com, recuperados da página de detalhes do lake no console), o Dataplex papel da conta de serviço (roles/dataplex.serviceAgent) no projeto que que contém o bucket. Esse papel fornece serviço do Dataplex com o papel de pré-requisito no nível do administrador no bucket para que permissões podem ser definidas no próprio bucket.

Conceder papéis para conjuntos de dados do BigQuery

Para anexar um conjunto de dados do BigQuery de outro projeto ao lake: você precisa conceder à conta de serviço do Dataplex, Administrador do BigQuery no conjunto de dados.

Considerações sobre o VPC Service Controls

O Dataplex não viola os perímetros do VPC Service Controls. Antes ao adicionar um recurso ao lake, verifique se o bucket ou conjunto de dados subjacente está usando a mesma rede VPC Service Controls que o lake.

Para mais informações, consulte VPC Service Controls com Dataplex (em inglês).

Adicionar um recurso

É possível adicionar um bucket do Cloud Storage ou um conjunto de dados do BigQuery emitindo um método da API Dataplex lakes.zones.assets.create ou adicionar um bucket ou conjunto de dados na página "Zona de dados" aberta em um navegador local.

Se não houver sobreposição entre a região do lake do Dataplex e uma das regiões de buckets do Cloud Storage, não é possível adicionar do bucket para uma zona no lake.

Para saber mais sobre a localização da região de um do Cloud Storage e como o Dataplex lida com local de um bucket ao criar o conjunto de dados de publicação, consulte Recursos regionais.

Console

  1. No console do Google Cloud, abra a página do Dataplex:

    Abra o Dataplex na Console do Google Cloud

  2. Na página Gerenciar, clique no lake em que você quer adicionar um bucket do Cloud Storage ou BigQuery no conjunto de dados. A página "Lake" será aberta.

    página de detalhes do lake
  3. Na guia Zonas, clique no nome da zona de dados em que você quer adicionar o recurso. A página da zona de dados para essa zona de dados é aberta.

  4. Na guia Recursos, clique em + Adicionar recursos. Página Adicionar recursos abre.

  5. Clique em Adicionar um recurso.

  6. No campo Tipo e selecione Conjunto de dados do BigQuery ou bucket do Cloud Storage.

  7. No campo Nome de exibição, digite um nome para o novo recurso.

  8. No campo Código, insira um ID exclusivo para o recurso.

  9. Opcional: digite uma Descrição.

  10. No campo Conjunto de dados ou Bucket (com base no tipo do recurso), Clique em Procurar para encontrar e selecionar o bucket do Cloud Storage ou conjunto de dados do BigQuery.

  11. Opcional: se o tipo de recurso for Bucket do Cloud Storage e você querer que o Dataplex gerencie o recurso, selecione a caixa de seleção Upgrade to Managed. Se você escolher essa opção, não será necessário fazer upgrade do recurso separadamente. Esta opção não está disponível para conjuntos de dados do BigQuery.

  12. Clique em Continuar.

  13. Escolha o restante dos valores de parâmetro. Para mais informações sobre as configurações de segurança, consulte Segurança do Lake.

  14. Clique em Enviar para adicionar o recurso.

  15. Verifique se você retornou para a página da zona de dados e se a nova recurso aparece na lista.

REST

Siga as instruções da API para adicionar um bucket usando o APIs Explorer.

Quando a adição é bem-sucedida, a zona de dados fica automaticamente ativa estado. Se falhar, a zona de dados será revertida para a um estado íntegro.

Fazer upgrade de um recurso de bucket do Cloud Storage

Quando você adiciona um recurso do tipo bucket do Cloud Storage, o Dataplex publica automaticamente tabelas externas do BigQuery para as tabelas hospedadas no recurso.

Ao fazer upgrade de um recurso de bucket do Cloud Storage, O Dataplex remove as tabelas externas anexadas e cria Tabelas do BigLake. As tabelas do BigLake oferecem suporte a uma segurança mais refinada, incluindo mascaramento de dados dinâmico, em nível de linha, de coluna e mascaramento de dados.

É possível fazer upgrade de um recurso de bucket do Cloud Storage no console do Google Cloud ou emitindo o método da API Dataplex Patch:

Console

  1. No console do Google Cloud, abra a página do Dataplex:

    Acesse o Dataplex.

  2. Na página Gerenciar, clique no nome do lake. A página "Lake" será aberta.

  3. Na guia Zonas, clique no nome da zona de dados. O a página da zona de dados será aberta.

  4. Na guia Recursos, clique no nome do recurso que você quer fazer o upgrade.

  5. Clique em Fazer upgrade para "Gerenciado".

REST

Siga as instruções da API para fazer upgrade de um recurso de bucket. usando o Cloud Explorer.

Fazer downgrade de um recurso de bucket do Cloud Storage

Quando você faz downgrade de um recurso de bucket do Cloud Storage, O Dataplex remove os arquivos tabelas do BigLake e cria em tabelas externas.

É possível fazer downgrade de um recurso de bucket do Cloud Storage no console do Google Cloud ou emitindo o método da API Dataplex Patch, com o campo readAccessMode definido como DIRECT em ResourceSpec

Console

  1. No console do Google Cloud, abra a página do Dataplex:

    Acesse o Dataplex.

  2. Na página Gerenciar, clique no nome do lake. A página "Lake" será aberta.

  3. Na guia Zonas, clique no nome da zona de dados. O a página da zona de dados será aberta.

  4. Na guia Recursos, clique no nome do recurso que você quer fazer o upgrade.

  5. Clique em Fazer downgrade de "Gerenciado".

REST

Siga as instruções da API para fazer downgrade de um recurso do bucket. usando o Cloud Explorer. Defina o readAccessMode campo para DIRECT em ResourceSpec.

Remover um recurso

É possível remover um bucket do Cloud Storage ou um conjunto de dados do BigQuery no console do Google Cloud ou emitindo a API Dataplex método lakes.zones.assets.delete. Remova o recurso da zona de dados ou data lake antes de anexá-lo a um diferente.

As instruções a seguir demonstram como remover um Dataplex usando o console do Google Cloud ou a API Dataplex.

Console

  1. No console do Google Cloud, abra a página do Dataplex:

    Abra o Dataplex na Console do Google Cloud

  2. Na página Gerenciar, clique no lake do qual você quiser remover um bucket do Cloud Storage ou conjunto de dados do BigQuery. A página do lake é aberta.

    página de detalhes do lake
  3. Na guia Zonas, clique no nome da zona de dados como remover o bucket do Cloud Storage ou o BigQuery conjunto de dados. A página da zona de dados será aberta.

  4. Na guia Recursos, marque a caixa à esquerda para selecionar o recurso. do nome do recurso.

  5. Clique em Excluir recurso para removê-lo.

  6. Na caixa de diálogo, clique em Excluir para confirmar a remoção.

REST

Siga as instruções da API para remover um bucket. usando o Cloud Explorer.

A seguir