Connettiti a Spanner
In qualità di amministratore BigQuery, puoi creare una connessione per accedere ai dati Spanner. Questa connessione consente agli analisti di dati di interrogare i dati in Spanner.
Prima di iniziare
- Abilita l'API BigQuery Connection.
-
Per ottenere le autorizzazioni necessarie per connetterti a Spanner, chiedi all'amministratore di concederti il ruolo IAM BigQuery Connection Admin (
roles/bigquery.connectionAdmin
) nel progetto. Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.
Crea connessioni Spanner
Seleziona una delle seguenti opzioni:
Console
Vai alla pagina BigQuery.
Nel riquadro Explorer, fai clic su
Aggiungi dati.Si apre la finestra di dialogo Aggiungi dati.
Nel riquadro Filtra per, seleziona Database nella sezione Tipo di origine dati.
In alternativa, nel campo Cerca origini dati, puoi inserire
Spanner
.Nella sezione Origini dati in evidenza, fai clic su Google Cloud Spanner.
Fai clic sulla scheda della soluzione Google Cloud Spanner: BigQuery Federation.
Nel riquadro Origine dati esterna, inserisci le seguenti informazioni:
- Per Tipo di connessione, seleziona Cloud Spanner.
- In Connection ID (ID connessione), inserisci un identificatore per la risorsa di connessione. Sono consentiti lettere, numeri e trattini bassi.
- Per Tipo di località, seleziona una località (o regione) BigQuery compatibile con la regione dell'origine dati esterna.
- (Facoltativo) In Nome descrittivo, inserisci un nome intuitivo per la
connessione, ad esempio
My connection resource
. Il nome descrittivo può essere qualsiasi valore che ti aiuti a identificare la risorsa di connessione se devi modificarla in un secondo momento. - (Facoltativo) In Descrizione, inserisci una descrizione per questa risorsa di connessione.
- In Nome database, inserisci il nome del database Spanner nel seguente formato:
"projects/PROJECT_ID/instances/INSTANCE/databases/DATABASE"
- (Facoltativo) Per eseguire letture parallele, seleziona Lettura di dati in parallelo. Spanner può dividere alcune query in parti più piccole, o partizioni, e recuperare le partizioni in parallelo. Per saperne di più, consulta la sezione Lettura parallela dei dati nella documentazione di Spanner. Questa opzione è limitata alle query il cui primo operatore nel piano di esecuzione è un operatore Distributed Union. Le altre query restituiscono un errore. Per visualizzare il piano di esecuzione query per una query Spanner, consulta Comprendere come Spanner esegue le query.
- (Facoltativo) Per Ruolo database, inserisci il nome di un ruolo database Spanner. Se non è vuoto, questa
connessione esegue query su Spanner utilizzando questo ruolo di database
per impostazione predefinita. Gli utenti controllo dell'accesso granulare di Spanner che inviano query tramite questa connessione devono aver ricevuto l'accesso a questo ruolo dal proprio amministratore e il ruolo del database deve disporre del privilegio
SELECT
su tutti gli oggetti schema specificati nelle query esterne. Per informazioni sul controllo dell'accesso granulare, vedi Informazioni sul controllo dell'accesso granulare. - (Facoltativo) Per attivare Data Boost, seleziona Utilizza Spanner Data Boost. Data Boost ti consente di eseguire query di analisi ed esportazioni di dati con un impatto quasi nullo sui carichi di lavoro esistenti nell'istanza BigQuery di cui è stato eseguito il provisioning. Per attivare Data Boost, seleziona Data Boost e Leggi i dati in parallelo.
Fai clic su Crea connessione.
bq
Per creare la connessione, utilizza il comando
bq mk
con il flag --connection
.
bq mk --connection \ --connection_type=CLOUD_SPANNER \ --properties='PROPERTIES' \ --location=LOCATION \ --display_name='FRIENDLY_NAME' \ --description 'DESCRIPTION' \ CONNECTION_ID
Sostituisci quanto segue:
PROPERTIES
: un oggetto JSON con i seguenti campi:"database"
: il database Spanner per la connessioneSpecifica come stringa nel seguente formato:
"projects/PROJECT_ID/instances/INSTANCE/databases/DATABASE"
."use_parallelism"
: (facoltativo) setrue
, questa connessione esegue letture paralleleIl valore predefinito è
false
. Spanner può dividere alcune query in parti più piccole, o partizioni, e recuperare le partizioni in parallelo. Per saperne di più, consulta la sezione Lettura parallela dei dati nella documentazione di Spanner. Questa opzione è limitata alle query il cui primo operatore nel piano di esecuzione è un operatore distributed union. Le altre query restituiscono un errore. Per visualizzare il piano di esecuzione query per una query Spanner, consulta Comprendere come Spanner esegue le query."database_role"
: (facoltativo) se non è vuoto, questa connessione esegue query Spanner utilizzando questo ruolo del database per impostazione predefinita. Gli utenti controllo dell'accesso granulare di Spanner che inviano query tramite questa connessione devono aver ricevuto l'accesso a questo ruolo dal proprio amministratore e il ruolo del database deve disporre del privilegioSELECT
su tutti gli oggetti schema specificati nelle query esterne.Se non specificata, la connessione viene autenticata con i ruoli predefiniti IAM per Spanner e all'entità che esegue query con questa connessione deve essere stato concesso il ruolo IAM
roles/spanner.databaseReader
.Per informazioni sul controllo dell'accesso granulare, vedi Informazioni sul controllo dell'accesso granulare.
"useDataBoost"
: (facoltativo) setrue
, questa connessione consente agli utenti di utilizzare Data Boost. Data Boost consente agli utenti di eseguire query federate in capacità di computing separate, indipendenti e distinte dalle istanze di cui è stato eseguito il provisioning per evitare di influire sui carichi di lavoro esistenti. Per attivare Data Boost, imposta"useDataBoost"
sutrue
e"use_parallelism"
sutrue
.Per utilizzare Data Boost, all'entità che esegue query con questa connessione deve essere concessa l'autorizzazione
spanner.databases.useDataBoost
. Questa autorizzazione è inclusa per impostazione predefinita nei ruoliroles/spanner.admin
eroles/spanner.databaseAdmin
.
LOCATION
: una località BigQuery che è compatibile con la regione dell'origine dati esterna.CONNECTION_ID
: un identificatore per la risorsa di connessioneL'ID connessione può contenere lettere, numeri e trattini bassi. Se non fornisci un ID connessione, BigQuery genera automaticamente un ID univoco.
L'esempio seguente crea una nuova risorsa di connessione denominata
my_connection_id
.bq mk --connection \ --connection_type='CLOUD_SPANNER' \ --properties='{"database":"projects/my_project/instances/my_instance/databases/database1"}' \ --project_id=federation-test \ --location=us \ my_connection_id
API
Chiama il metodo CreateConnection
all'interno
del servizio ConnectionService
.
Condividere le connessioni con gli utenti
Puoi concedere i seguenti ruoli per consentire agli utenti di eseguire query sui dati e gestire le connessioni:
roles/bigquery.connectionUser
: consente agli utenti di utilizzare le connessioni per connettersi a origini dati esterne ed eseguire query.roles/bigquery.connectionAdmin
: consente agli utenti di gestire le connessioni.
Per saperne di più sui ruoli e sulle autorizzazioni IAM in BigQuery, consulta Ruoli e autorizzazioni predefiniti.
Seleziona una delle seguenti opzioni:
Console
Vai alla pagina BigQuery.
Le connessioni sono elencate nel tuo progetto, in un gruppo chiamato Connessioni esterne.
Nel riquadro Explorer, fai clic sul nome del progetto > Connessioni esterne > connessione.
Nel riquadro Dettagli, fai clic su Condividi per condividere una connessione. Quindi:
Nella finestra di dialogo Autorizzazioni di connessione, condividi la connessione con altre entità aggiungendo o modificando le entità.
Fai clic su Salva.
bq
Non puoi condividere una connessione con lo strumento a riga di comando bq. Per condividere una connessione, utilizza la console Google Cloud o il metodo dell'API BigQuery Connections per condividere una connessione.
API
Utilizza il
metodo projects.locations.connections.setIAM
nella sezione di riferimento dell'API REST BigQuery Connections e
fornisci un'istanza della risorsa policy
.
Java
Prima di provare questo esempio, segui le istruzioni di configurazione di Java nella guida rapida di BigQuery per l'utilizzo delle librerie client. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API BigQuery Java.
Per eseguire l'autenticazione in BigQuery, configura le Credenziali predefinite dell'applicazione. Per saperne di più, vedi Configurare l'autenticazione per le librerie client.
Passaggi successivi
- Scopri i diversi tipi di connessione.
- Scopri di più sulla gestione delle connessioni.
- Scopri di più sulle query federate.
- Scopri come eseguire query sui dati di Spanner.