Accedere agli endpoint gRPC per Dataproc Metastore

Questa pagina spiega come concedere a un account utente Google Cloud o a un account di servizio l'accesso a un servizio Dataproc Metastore che utilizza il protocollo endpoint gRPC.

Informazioni sulla concessione dei ruoli dei metadati gRPC

Quando concedi a un account l'accesso ai tuoi metadati, considera i seguenti concetti:

  • Il livello di accesso da fornire. Il livello di accesso che concedi controlla la quantità di metadati a cui un account può accedere. Ad esempio, puoi scegliere di fornire l'accesso ai metadati archiviati in un database specifico, in una tabella specifica o puoi fornire l'accesso all'intero progetto.
  • L'entità che richiede l'accesso. Utilizzi le entità IAM (identità) per eseguire i job. Ad esempio, puoi eseguire job del cluster Dataproc con account utente o service account (in genere il service account VM Dataproc).

    Per ulteriori informazioni sugli account che puoi utilizzare con Dataproc Metastore, consulta Service account Dataproc.

A seconda dell'ambito di controllo richiesto, concedi alla tua entità uno dei seguenti ruoli IAM predefiniti:

  • Per concedere l'accesso completo alle risorse di metadati. Ruolo Proprietario dei metadati (roles/metastore.metadataOwner)
  • Per concedere l'accesso in lettura e scrittura ai metadati: ruolo Editor metadati roles/metastore.metadataEditor)
  • Per concedere l'accesso in lettura ai metadati: ruolo Visualizzatore metadati (roles/metastore.metadataViewer)

Prima di iniziare

  • Abilita Dataproc Metastore nel tuo progetto.
  • Crea un servizio metastore che utilizza il protocollo gRPC.
  • Comprendi i requisiti di rete specifici per il tuo progetto.

    • Requisiti di gRPC e Virtual Private Cloud (VPC). Se utilizzi gRPC, non devi configurare un VPC condiviso né impostare configurazioni di rete aggiuntive. Per impostazione predefinita, gli endpoint gRPC sono raggiungibili da qualsiasi VPC.

    Tuttavia, esiste un'eccezione. Se il tuo progetto utilizza un perimetro di servizio VPC-SC, gli endpoint gRPC possono essere raggiunti solo da un VPC appartenente a progetti all'interno del perimetro. Per maggiori informazioni, consulta Controlli di servizio VPC con Dataproc Metastore.

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per concedere a un principal l'accesso ai metadati di Dataproc Metastore, chiedi all'amministratore di concederti i seguenti ruoli IAM sul tuo progetto, seguendo il principio del privilegio minimo:

Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

Questi ruoli predefiniti contengono le autorizzazioni necessarie per concedere a un'entità l'accesso ai metadati di Dataproc Metastore. Per vedere quali sono esattamente le autorizzazioni richieste, espandi la sezione Autorizzazioni obbligatorie:

Autorizzazioni obbligatorie

Per concedere a un principal l'accesso ai metadati di Dataproc Metastore sono necessarie le seguenti autorizzazioni:

  • resourcemanager.projects.get
  • resourcemanager.projects.getIamPolicy
  • resourcemanager.projects.setIamPolicy

Potresti anche ottenere queste autorizzazioni con ruoli personalizzati o altri ruoli predefiniti.

Per ulteriori informazioni su ruoli e autorizzazioni specifici di Dataproc Metastore, consulta la panoramica di IAM di Dataproc Metastore.

Concedere a un account principale l'accesso ai metadati

Puoi concedere a un account principale l'accesso ai metadati a livello di progetto, di servizio, di database o di tabella.

Concedi l'accesso a livello di progetto

Per concedere l'accesso a tutti i metadati di Dataproc Metastore a livello di progetto, devi concedere un ruolo di metadati al tuo account principale.

Interfaccia a riga di comando gcloud

Per concedere i ruoli di metadati a tutti i servizi Dataproc Metastore in un progetto specificato, esegui il seguente comando gcloud projects add-iam-policy-binding:

gcloud projects add-iam-policy-binding PROJECT_ID \
    --member=PRINCIPAL \
    --role=METASTORE_ROLE

Sostituisci quanto segue:

  • PROJECT_ID: l'ID progetto Google Cloud a cui vuoi concedere l'accesso ai metadati.
  • PRINCIPAL: Il tipo e l'ID email (indirizzo email) del principal.
    • Per gli account utente: user:EMAIL_ID
    • Per i service account: serviceAccount:EMAIL_ID
    • Per Google Gruppi: group:EMAIL_ID
    • Per altri tipi di entità: Identificatori dell'entità
  • METASTORE_ROLE: uno dei seguenti ruoli, a seconda dell'ambito di accesso che vuoi concedere all'entità: roles/metastore.metadataViewer, roles/metastore.metadataEditor o roles/metastore.metadataOwner.

Concedi l'accesso a livello di servizio

Per concedere l'accesso a tutti i metadati di Dataproc Metastore a livello di servizio, devi concedere un ruolo di metadati al tuo account principale.

Interfaccia a riga di comando gcloud

Per concedere ruoli di metadati con la granularità di un singolo servizio metastore Dataproc Metastore, esegui il seguente comando gcloud metastore services add-iam-policy-binding:

gcloud metastore services add-iam-policy-binding SERVICE_ID \
  --location=LOCATION \
  --member=PRINCIPAL \
  --role=METASTORE_ROLE

Sostituisci quanto segue:

  • SERVICE_ID: l'ID o l'identificatore completo del servizio Dataproc Metastore.
  • LOCATION: la regione di Dataproc Metastore a cui stai concedendo l'accesso.
  • PRINCIPAL: il tipo e l'ID email (indirizzo email) dell'account principale:
    • Per gli account utente: user:EMAIL_ID
    • Per i service account: serviceAccount:EMAIL_ID
    • Per Google Gruppi: group:EMAIL_ID
    • Per altri tipi di entità: Identificatori dell'entità
  • METASTORE_ROLE: uno dei seguenti ruoli, a seconda dell'ambito di accesso che vuoi concedere all'entità: roles/metastore.metadataViewer,roles/metastore.metadataEditor o roles/metastore.metadataOwner.

Concedere l'accesso a livello di database

Per concedere l'accesso a tutti i metadati di Dataproc Metastore in un database specifico, devi aggiungere un ruolo di metadati al tuo account principale.

Interfaccia a riga di comando gcloud

Per concedere ruoli di metadati con la granularità di un database specifico, esegui il comando gcloud metastore services databases add-iam-policy-binding:

gcloud metastore services databases add-iam-policy-binding DATABASE_ID \
  --project=PROJECT \
  --location=LOCATION \
  --service=SERVICE_ID \
  --member=PRINCIPAL \
  --role=METASTORE_ROLE

Sostituisci quanto segue:

  • DATABASE_ID: l'ID del database a cui stai concedendo l'accesso ai metadati. Puoi recuperare questo ID dallo schema del database.
  • PROJECT: l'ID progetto Google Cloud che contiene il servizio Dataproc Metastore a cui stai concedendo l'accesso ai metadati.
  • LOCATION: la regione del servizio Dataproc Metastore a cui stai concedendo l'accesso.
  • SERVICE_ID: l'ID o l'identificatore completo del servizio Dataproc Metastore.
  • PRINCIPAL: il tipo e l'ID email (indirizzo email) dell'account principale:
    • Per gli account utente: user:EMAIL_ID
    • Per i service account: serviceAccount:EMAIL_ID
    • Per Google Gruppi: group:EMAIL_ID
    • Per altri tipi di entità: Identificatori dell'entità
  • METASTORE_ROLE: uno dei seguenti ruoli, a seconda dell'ambito di accesso che vuoi concedere all'entità: roles/metastore.metadataViewer, roles/metastore.metadataEditor o roles/metastore.metadataOwner.

Concedere l'accesso a livello di tabella

Per concedere l'accesso a tutti i metadati di Dataproc Metastore in una tabella specifica, devi concedere un ruolo di metadati al tuo account principale.

Interfaccia a riga di comando gcloud

Per concedere ruoli di metadati con granularità a livello di tabella, esegui il seguente comando gcloud metastore services databases tables add-iam-policy-binding:

gcloud metastore services databases tables add-iam-policy-binding TABLE_ID \
  --database=DATABASE_ID \
  --project=PROJECT \
  --location=LOCATION \
  --service=SERVICE_ID \
  --member=PRINCIPAL \
  --role=METASTORE_ROLE

Sostituisci quanto segue:

  • TABLE_ID: l'ID della tabella a cui stai concedendo l'accesso. Puoi recuperare questo ID dallo schema del database.
  • DATABASE_ID: l'ID del database che contiene la tabella a cui stai concedendo l'accesso ai metadati. Puoi recuperare questo ID dallo schema del database.
  • PROJECT: l'ID progetto Google Cloud che contiene il servizio Dataproc Metastore a cui stai concedendo l'accesso ai metadati.
  • LOCATION: la regione del servizio Dataproc Metastore a cui stai concedendo l'accesso ai metadati.
  • SERVICE_ID: l'ID o l'identificatore completo del servizio Dataproc Metastore.
  • PRINCIPAL: il tipo e l'ID email (indirizzo email) dell'account principale:
    • Per gli account utente: user:EMAIL_ID
    • Per i service account: serviceAccount:EMAIL_ID
    • Per Google Gruppi: group:EMAIL_ID
  • METASTORE_ROLE: uno dei seguenti ruoli, a seconda dell'ambito di accesso che vuoi concedere all'entità: roles/metastore.metadataViewer, roles/metastore.metadataEditor o roles/metastore.metadataOwner.

Dopo aver concesso l'accesso ai metadati

Dopo aver concesso i ruoli richiesti agli account di servizio, puoi connettere Dataproc Metastore a un cluster Dataproc. Il cluster utilizza quindi il servizio Dataproc Metastore come metastore Hive.

Passaggi successivi