Présentation de la connexion par défaut
Pour simplifier votre workflow, vous pouvez configurer des connexions aux ressources cloud par défaut dans BigQuery pour créer des tables et des modèles.
BigQuery accepte les connexions par défaut dans les tables et modèles suivants:
- Tables BigLake Cloud Storage externes
- Tables d'objets Cloud Storage externes
- Tables BigQuery pour Apache Iceberg
- Modèles distants
Les administrateurs configurent la connexion de ressource Cloud par défaut pour un projet.
Si vous créez des tables et des modèles dans un projet, vous pouvez choisir la connexion par défaut que les administrateurs ont configurée en spécifiant DEFAULT
dans les clauses SQL suivantes:
- Clause
WITH CONNECTION
d'une instructionCREATE TABLE
- Clause
REMOTE WITH CONNECTION
d'une instructionCREATE MODEL
.
Si vous n'êtes pas administrateur, vous ne pouvez pas modifier les autorisations ni d'autres configurations de la connexion par défaut. À la place, la connexion par défaut est automatiquement résolue en une connexion existante référencée dans la configuration du projet, ce qui lui donne les autorisations et les ressources requises.
Avant de commencer
Enable the BigQuery Connection API.
Rôles et autorisations requis
Pour connaître les rôles et autorisations requis pour configurer et utiliser les connexions par défaut dans BigQuery, consultez Gérer les connexions.
Provisionnement des autorisations lors de l'utilisation de CONNECTION DEFAULT
En fonction du type de table ou de modèle que vous créez avec la connexion par défaut,Google Cloud met automatiquement à jour les rôles attribués au compte de service de la connexion. Les rôles suivants sont automatiquement attribués au compte de service pour la connexion de ces tables et modèles:
Type de table ou de modèle | Ressource distante | Rôles attribués au compte de service de la connexion |
---|---|---|
Table BigLake Cloud Storage | Cloud Storage | roles/storage.legacyBucketReader roles/storage.legacyObjectReader |
Table d'objets | Cloud Storage | roles/storage.legacyBucketReader roles/storage.legacyObjectReader |
Tables BigQuery pour Iceberg | Cloud Storage | roles/storage.legacyBucketWriter roles/storage.legacyObjectOwner |
Modèles BigQuery ML distants sur des modèles Vertex AI | Modèles appartenant à Google | roles/aiplatform.user |
Déplorable sur un point de terminaison à partir de Model Garden | ||
Modèles utilisateur | ||
Modèles ajustés | roles/aiplatform.serviceAgent |
|
Modèles distants BigQuery ML sur les services Cloud AI | Processeur de documents | roles/documentai.apiUser |
Reconnaissance vocale | roles/speech.serviceAgent |
|
Cloud NLP | roles/serviceusage.serviceUsageConsumer |
|
Cloud Vision | roles/serviceusage.serviceUsageConsumer |
|
Cloud Translation | roles/cloudtranslate.user |
Configurer la connexion par défaut d'un projet
En tant qu'administrateur, configurez la connexion de ressource Cloud par défaut pour le projet:
Pour créer et configurer la connexion de ressource Cloud par défaut, utilisez l'instruction LDD
ALTER PROJECT SET OPTIONS
.L'exemple suivant configure la connexion par défaut du projet:
ALTER PROJECT PROJECT_ID SET OPTIONS ( `region-REGION.default_cloud_resource_connection_id` = CONNECTION_ID);
Remplacez les éléments suivants :
PROJECT_ID
: ID du projet dans lequel vous définissez la connexion par défaut.REGION
: région de la connexion.CONNECTION_ID
: ID ou nom de la connexion à utiliser par défaut pour les tables et les modèles. Spécifiez uniquement l'ID ou le nom de la connexion, et excluez les ID de projet et les préfixes de région associés au nom ou à l'ID.
Pour en savoir plus sur la configuration d'une connexion par défaut pour un projet, consultez la section Gérer les configurations par défaut.
Créer des tables à l'aide de CONNECTION DEFAULT
Les exemples suivants montrent comment créer des tables spécifiant WITH CONNECTION
DEFAULT
dans BigQuery.
Exemple: Créer une table BigLake Cloud Storage
L'expression SQL suivante crée une table BigLake Cloud Storage avec une connexion par défaut:
CREATE EXTERNAL TABLE PROJECT_ID.DATASET.EXTERNAL_TABLE_NAME
WITH CONNECTION DEFAULT
OPTIONS (
format = 'TABLE_FORMAT',
uris = ['BUCKET_PATH']);
Exemple: Créer une table d'objets avec une connexion par défaut
L'expression SQL suivante crée une table d'objets avec une connexion par défaut:
CREATE EXTERNAL TABLE PROJECT_ID.DATASET.EXTERNAL_TABLE_NAME
WITH CONNECTION DEFAULT
OPTIONS (
object_metadata = 'SIMPLE'
uris = ['BUCKET_PATH']);
Exemple: Créer une table BigQuery pour Iceberg avec une connexion par défaut
L'expression SQL suivante crée une table BigQuery pour Iceberg avec une connexion par défaut:
CREATE TABLE `myproject.tpch_clustered.nation` (
n_nationkey integer,
n_name string,
n_regionkey integer,
n_comment string)
CLUSTER BY n_nationkey
WITH CONNECTION DEFAULT
OPTIONS (
file_format = 'PARQUET',
table_format = 'ICEBERG',
storage_uri = 'gs://mybucket/warehouse/nation');
Créer des modèles à l'aide de REMOTE WITH CONNECTION DEFAULT
Les exemples suivants montrent comment créer des modèles spécifiant REMOTE WITH
CONNECTION DEFAULT
dans BigQuery.
Exemple: Créer un modèle distant sur un modèle Vertex AI
L'expression SQL suivante crée un modèle distant avec une connexion par défaut:
CREATE OR REPLACE MODEL `mydataset.flash_model`
REMOTE WITH CONNECTION DEFAULT
OPTIONS(ENDPOINT = 'gemini-1.5-flash-001');
Exemple: Créer un modèle distant sur un service Cloud AI
L'expression SQL suivante crée un SERVICE de modèle distant avec une connexion par défaut:
CREATE MODEL `project_id.mydataset.mymodel`
REMOTE WITH CONNECTION DEFAULT
OPTIONS(REMOTE_SERVICE_TYPE = 'CLOUD_AI_VISION_V1')
Exemple: Créer un modèle distant avec un point de terminaison HTTPS
L'expression SQL suivante crée un modèle distant avec un point de terminaison HTTPS et une connexion par défaut:
CREATE MODEL `project_id.mydataset.mymodel`
INPUT(f1 INT64, f2 FLOAT64, f3 STRING, f4 ARRAY)
OUTPUT(out1 INT64, out2 INT64)
REMOTE WITH CONNECTION DEFAULT
OPTIONS(ENDPOINT = 'https://us-central1-aiplatform.googleapis.com/v1/projects/myproject/locations/us-central1/endpoints/1234')
Étape suivante
- Découvrez la configuration par défaut dans BigQuery.