Gestire gli asset di dati utilizzando Data Catalog

Data Catalog è una funzionalità di Dataplex che cataloga automaticamente i metadati delle risorse Bigtable. Questa funzionalità consente alla tua organizzazione di cercare e gestire gli asset di dati Bigtable.

I metadati vengono sincronizzati automaticamente da Bigtable a Data Catalog per le seguenti risorse Bigtable:

  • Istanze
  • Cluster
  • Tabelle, inclusi i dettagli della famiglia di colonne

Data Catalog è un servizio di gestione dei metadati completamente gestito all'interno di Dataplex. Fornisce una visualizzazione unificata e meccanismi di tagging per i metadati tecnici e aziendali. Per scoprire di più su Data Catalog e perché dovresti utilizzarlo, consulta Che cos'è Data Catalog.

Vantaggi dell'utilizzo di Data Catalog con Bigtable

Le informazioni di Data Catalog sui tuoi dati possono contribuire a semplificare analisi, riutilizzo dei dati, sviluppo di applicazioni e gestione dei dati.

Puoi cercare le voci in Data Catalog per nome della risorsa o per dettagli. Ad esempio, puoi cercare il nome di un'istanza per trovare la voce relativa o una famiglia di colonne per trovare la voce di una tabella. Puoi anche utilizzare una ricerca filtrata, applicando filtri per restringere la ricerca. Per ulteriori informazioni, consulta Cercare e visualizzare gli asset di dati con Data Catalog.

Il tagging degli asset di dati può aiutarti a comprendere e catalogare i dati disponibili nelle tabelle Bigtable per renderli più rilevabili e cercabili da altri utenti di Data Catalog e come parte della tua raccolta di dati più ampia. Utilizzi i tag per aggiungere i tuoi metadati ai metadati catalogati e poi puoi utilizzare questi tag per eseguire ricerche.

Inizia a utilizzare Data Catalog

Per iniziare a utilizzare Data Catalog per gestire gli asset di dati Bigtable, completa le seguenti attività:

  1. Se non hai mai utilizzato Data Catalog, abilita l'API.

  2. Concedi ruoli IAM alle entità che richiedono accesso alle voci Bigtable in Data Catalog.

  3. Scopri come cercare gli asset di dati leggendo l'articolo Come eseguire una ricerca con Data Catalog.

  4. Esamina la sintassi di ricerca di Data Catalog per capire come trovare i metadati.

  5. Leggi i concetti sul tagging delle voci di Data Catalog in Tag e modelli di tag

Metodi per cercare i metadati di Bigtable

Puoi cercare i metadati di Bigtable sincronizzati utilizzando Data Catalog.

Oltre ai qualificatori standard, puoi cercare le risorse Bigtable con quanto segue:

  • Istanza

    • Nome dell'istanza Bigtable
    • ID istanza Bigtable
    • Località del cluster
    • ID cluster
  • Tabella

    • ID tabella
    • Nome famiglia di colonne
    • Nome dell'istanza Bigtable
    • ID istanza Bigtable

Ruoli obbligatori

La visualizzazione, l'applicazione di tag e la ricerca delle risorse Bigtable in Data Catalog hanno requisiti di autorizzazione diversi. In generale, assegna alle entità della tua organizzazione il ruolo minimo necessario per svolgere un'attività.

Autorizzazione per visualizzare i tag pubblici e privati

Per ottenere le autorizzazioni necessarie per visualizzare i tag pubblici e privati nelle risorse Bigtable, chiedi all'amministratore di concederti i seguenti ruoli IAM:

Questi ruoli predefiniti contengono le autorizzazioni necessarie per visualizzare i tag pubblici e privati. Le autorizzazioni esatte richieste sono le seguenti:

  • bigtable.instances.get
  • bigtable.clusters.get
  • bigtable.tables.get
  • datacatalog.tagTemplates.getTag

Autorizzazione per la ricerca nelle risorse Bigtable

Per ottenere le autorizzazioni necessarie per eseguire ricerche nelle risorse Bigtable in Data Catalog, chiedi all'amministratore di concederti i seguenti ruoli IAM:

Questi ruoli predefiniti contengono le autorizzazioni necessarie per eseguire ricerche nelle risorse Bigtable. Le autorizzazioni esatte richieste sono:

  • bigtable.instances.get
  • bigtable.clusters.get
  • bigtable.tables.get

Autorizzazione per collegare i tag alle risorse Bigtable

Per ottenere le autorizzazioni necessarie per associare i tag alle risorse Bigtable in Data Catalog, chiedi all'amministratore di concederti i seguenti ruoli IAM:

Questi ruoli predefiniti contengono le autorizzazioni necessarie per aggiungere tag pubblici e privati. Le autorizzazioni esatte richieste sono le seguenti:

  • bigtable.instances.update
  • bigtable.clusters.update
  • bigtable.tables.update
  • datacatalog.tagTemplates.use
  • datacatalog.entries.updateTag

(Facoltativo) Crea un ruolo personalizzato

Puoi creare un ruolo personalizzato da concedere agli utenti che richiedono l'accesso completo a tutti i metadati di Bigtable in Data Catalog nel tuo progetto o nella tua organizzazione. Poi puoi impostare qualsiasi account utente o di servizio che deve accedere come entità del ruolo personalizzato. Per scoprire di più sui ruoli personalizzati, consulta Ruoli e autorizzazioni.

Scegli un nome significativo per il ruolo, ad esempio Editor del catalogo di dati Bigtable, quindi assegna solo le entità che devono accedere al ruolo. Per le istruzioni di configurazione, vedi Creare un ruolo personalizzato.

Concedi le seguenti autorizzazioni al ruolo personalizzato:

  • bigtable.instances.get
  • bigtable.instances.update
  • bigtable.clusters.get
  • bigtable.clusters.update
  • bigtable.tables.get
  • bigtable.tables.update
  • datacatalog.tagTemplates.getTag
  • datacatalog.tagTemplates.use

Per informazioni dettagliate sulle autorizzazioni di Data Catalog, consulta Ruoli per eseguire ricerche nelle risorse Google Cloud. Per le descrizioni delle autorizzazioni Bigtable, vedi Autorizzazioni.

Vincoli noti

La sezione seguente elenca alcuni vincoli da tenere presente prima di utilizzare Data Catalog per gestire i metadati di Bigtable.

Vincoli relativi alla località

Se la tua organizzazione ha configurato limitazioni di località, le voci dei metadati per le risorse Bigtable potrebbero non essere sincronizzate con Data Catalog. Eventuali voci create prima dell'applicazione dei vincoli di località vengono conservate da Data Catalog.

Per consentire a Data Catalog di caricare le risorse, ti consigliamo di aggiungere la regione multipla global al criterio di località.

Eccezione per il nome della famiglia di colonne

L'API Data Catalog rifiuta le richieste in cui il nome della famiglia di colonne nella richiesta include un punto (.). Ad esempio, se il nome della famiglia di colonne è personal.info.

Passaggi successivi