Introduzione alle connessioni
BigQuery ti consente di eseguire query sui dati archiviati al di fuori di BigQuery in servizi Google Cloud come Cloud Storage o Spanner oppure in origini di terze parti come AWS o Azure. Queste connessioni esterne utilizzano l'API BigQuery Connection.
Ad esempio, supponiamo che tu archivi i dettagli degli ordini dei clienti in Cloud SQL e i dati sulle vendite in BigQuery e che tu voglia unire le due tabelle in un'unica query. Puoi creare una connessione Cloud SQL al database esterno utilizzando l'API BigQuery Connection. Con le connessioni, non invii mai le credenziali del database come testo non cifrato.
Una connessione viene criptata e archiviata in modo sicuro nel servizio di connessione BigQuery. Puoi concedere agli utenti l'accesso alle connessioni granting them BigQuery connection Identity and Access Management (IAM) roles.
Tipi di connessione
BigQuery fornisce diversi tipi di connessione per le seguenti origini dati esterne:
- Amazon Simple Storage Service (Amazon S3)
- Apache Spark
- Azure Blob Storage
- Risorse Google Cloud come modelli remoti di Vertex AI, funzioni remote e BigLake
- Spanner
- Cloud SQL
- AlloyDB per PostgreSQL
- SAP Datasphere
Connessioni Amazon S3
Per creare una connessione Amazon S3 con BigQuery Omni, consulta Eseguire la connessione ad Amazon S3.
Una volta stabilita una connessione ad Amazon S3, puoi:
- Creare tabelle esterne su Amazon S3
- Esegui query sui dati di Amazon S3
- Esportare i risultati in Amazon S3
- Crea set di dati basati sui database AWS Glue.
Connessioni Spark
Le stored procedure per Spark ti consentono di eseguire stored procedure scritte in Python utilizzando BigQuery. Una connessione Spark ti consente di connetterti a Dataproc Serverless ed eseguire le stored procedure per Spark.
Per creare questa connessione, consulta Creare connessioni.
Connessioni Archiviazione blob
Per creare una connessione a Blob Storage con BigQuery Omni, consulta Collegarsi all'archiviazione BLOB.
Una volta stabilita una connessione a Blob Storage, puoi:
- Creare tabelle esterne basate su Archiviazione BLOB
- Eseguire query sui dati di Blob Storage
- Esportare i risultati in Archiviazione blob
Connessioni alle risorse Google Cloud
Una connessione alla risorsa Google Cloud è una connessione per autorizzare l'accesso ad altre risorse Google Cloud come i modelli remoti di Vertex AI, le funzioni remote e BigLake. Per informazioni dettagliate su come configurare una connessione alla risorsa Google Cloud, consulta Creare e configurare una connessione alla risorsa Cloud.
Una volta creata una connessione alla risorsa Google Cloud, puoi utilizzare gli oggetti BigQuery elencati di seguito:
- Modelli remoti. Per ulteriori informazioni, consulta l'istruzione CREATE MODEL per i modelli remoti su LLM, l'istruzione CREATE MODEL per i modelli remoti sui servizi Cloud AI e l'istruzione CREATE MODEL per i modelli remoti sui modelli ospitati da Vertex AI.
- Funzioni remote. Le funzioni remote di BigQuery consentono di implementare funzioni con qualsiasi lingua supportata nelle funzioni Cloud Run o in Cloud Run. Una connessione della funzione remota ti consente di connetterti alle funzioni Cloud Run o a Cloud Run ed eseguirle. Per creare una connessione a una funzione remota BigQuery, consulta Creare una connessione.
- Tabelle BigLake. Le connessioni BigLake collegano tabelle BigLake a origini dati esterne mantenendo il controllo dell'accesso e la sicurezza granulari di BigQuery per i dati strutturati e non strutturati in Cloud Storage.
- Tabelle di oggetti. Per ulteriori informazioni, consulta Introduzione alle tabelle oggetti.
Connessioni Spanner
Per creare una connessione Spanner, vedi Eseguire la connessione a Spanner.
Una volta stabilita una connessione Spanner, puoi eseguire query federate.
Connessioni Cloud SQL
Per creare una connessione Cloud SQL, consulta Connettersi a Cloud SQL.
Una volta stabilita una connessione Cloud SQL esistente, puoi eseguire query federate.
Connessioni AlloyDB
Per creare una connessione AlloyDB, consulta Connettersi ad AlloyDB per PostgreSQL.
Una volta stabilita una connessione AlloyDB esistente, puoi eseguire query federate.
Connessioni SAP Datasphere
Per creare una connessione SAP Datasphere, consulta Eseguire la connessione a SAP Datasphere.
Una volta stabilita una connessione SAP Datasphere, puoi eseguire query federate.
Audit log
BigQuery registra le richieste di utilizzo e gestione delle connessioni. Per ulteriori informazioni, consulta la panoramica dei log di controllo di BigQuery.
Passaggi successivi
- Scopri come gestire le connessioni.
- Scopri come analizzare le tabelle di oggetti utilizzando le funzioni remote.
- Scopri come eseguire query sui dati archiviati:
- Esegui query sui dati archiviati in Amazon S3.
- Esegui query sui dati archiviati in Archiviazione blob.
- Esegui query sui dati strutturati archiviati in Cloud Storage.
- Esegui query sui dati non strutturati archiviati in Cloud Storage.
- Esegui query sui dati archiviati in Spanner.
- Esegui query sui dati archiviati in Cloud SQL.
- Esegui query sui dati archiviati in AlloyDB.
- Esegui query sui dati utilizzando funzioni remote.
- Esegui query sui dati non strutturati utilizzando le funzioni remote.
- Esegui query sui dati utilizzando le procedure memorizzate per Apache Spark.
- Scopri di più sulle tabelle esterne.