Introducción a las conexiones
BigQuery te permite crear conexiones externas para consultar datos que están almacenados fuera de BigQuery en Google Cloud servicios como Cloud Storage o Spanner, o en fuentes de terceros como Amazon Web Services (AWS) o Microsoft Azure. Estas conexiones externas usan la API Connection de BigQuery.
Por ejemplo, supongamos que almacenas detalles sobre los pedidos de los clientes en Cloud SQL y datos sobre las ventas en BigQuery, y quieres combinar las dos tablas en una sola consulta. Puedes crear una conexión de Cloud SQL a la base de datos externa mediante la API de conexión de BigQuery. Con las conexiones, nunca se envían las credenciales de la base de datos como texto sin formato.
Una conexión se cifra y se almacena de forma segura en el servicio de conexión de BigQuery. Puedes dar acceso a las conexiones a los usuarios asignándoles roles de gestión de identidades y accesos (IAM) de BigQuery.
Tipos de conexión
BigQuery ofrece diferentes tipos de conexión para las siguientes fuentes de datos externas:
- Amazon Simple Storage Service (Amazon S3)
- Apache Spark
- Azure Blob Storage
- Google Cloud recursos como modelos remotos de Vertex AI, funciones remotas y BigLake
- Spanner
- Cloud SQL
- AlloyDB for PostgreSQL
- SAP Datasphere
Conexiones de Amazon S3
Para crear una conexión de Amazon S3 con BigQuery Omni, consulta el artículo Conectarse a Amazon S3.
Una vez que tengas una conexión de Amazon S3, podrás hacer lo siguiente:
- Crear tablas externas en Amazon S3
- Consultar los datos de Amazon S3
- Exportar resultados a Amazon S3
- Crea conjuntos de datos basados en bases de datos de AWS Glue.
Fomentar las conexiones
Los procedimientos almacenados de Spark te permiten ejecutar procedimientos almacenados escritos en Python mediante BigQuery. Una conexión de Spark te permite conectarte a Serverless para Apache Spark y ejecutar los procedimientos almacenados de Spark.
Para crear esta conexión, consulta Crear conexiones.
Conexiones de almacenamiento de blobs
Para crear una conexión de Blob Storage con BigQuery Omni, consulta Conectarse a Blob Storage.
Una vez que tengas una conexión a Blob Storage, podrás hacer lo siguiente:
- Crear tablas externas basadas en el almacenamiento de blobs
- Consultar los datos de Blob Storage
- Exportar resultados a Blob Storage
Google Cloud conexiones de recursos
Una Google Cloud conexión de recursos es una conexión para autorizar el acceso a otros Google Cloud recursos, como modelos remotos, funciones remotas y BigLake de Vertex AI. Para obtener información sobre cómo configurar una Google Cloud conexión de recursos, consulta el artículo Crear y configurar una conexión de recursos de Cloud.
Una vez que tenga una conexión de recursos, podrá crear los siguientes objetos de BigQuery con ella: Google Cloud
- Modelos remotos. Para obtener más información, consulta Instrucción CREATE MODEL para modelos remotos sobre LLMs, Instrucción CREATE MODEL para modelos remotos sobre servicios de IA de Cloud e Instrucción CREATE MODEL para modelos remotos sobre modelos alojados en Vertex AI.
- Funciones remotas. Las funciones remotas de BigQuery te permiten implementar funciones con cualquier lenguaje compatible en Cloud Run functions o Cloud Run. Una conexión de función remota te permite conectarte con funciones de Cloud Run o Cloud Run y ejecutar estas funciones. Para crear una conexión de función remota de BigQuery, consulta Crear una conexión.
- Tablas de BigLake. Las conexiones de BigLake conectan tablas de BigLake a fuentes de datos externas y, al mismo tiempo, conservan el control de acceso y la seguridad pormenorizados de BigQuery para los datos estructurados y no estructurados de Cloud Storage.
- Tablas de objetos. Para obtener más información, consulta Introducción a las tablas de objetos.
Conexiones de Spanner
Para crear una conexión de Spanner, consulta Conectarse a Spanner.
Una vez que tengas una conexión de Spanner, podrás ejecutar consultas federadas.
Conexiones de Cloud SQL
Para crear una conexión de Cloud SQL, consulta Conectarse a Cloud SQL.
Una vez que tengas una conexión de Cloud SQL, podrás ejecutar consultas federadas.
Conexiones de AlloyDB
Para crear una conexión de AlloyDB, consulta Conectarse a AlloyDB para PostgreSQL.
Una vez que tengas una conexión de AlloyDB, podrás ejecutar consultas federadas.
Conexiones de SAP Datasphere
Para crear una conexión de SAP Datasphere, consulta Conectarse a SAP Datasphere.
Una vez que tengas una conexión de SAP Datasphere, podrás ejecutar consultas federadas.
Registros de auditoría
BigQuery registra el uso y las solicitudes de gestión de las conexiones. Para obtener más información, consulta el resumen de los registros de auditoría de BigQuery.
Siguientes pasos
- Consulta cómo gestionar las conexiones.
- Más información sobre las conexiones predeterminadas de tu proyecto
- Consulta cómo analizar tablas de objetos mediante funciones remotas.
- Consulta cómo consultar datos almacenados:
- Consultar datos almacenados en Amazon S3.
- Consulta los datos almacenados en el almacenamiento de blobs.
- Consultar datos estructurados almacenados en Cloud Storage.
- Consultar datos sin estructurar almacenados en Cloud Storage.
- Consulta datos almacenados en Spanner.
- Consulta los datos almacenados en Cloud SQL.
- Consultar datos almacenados en AlloyDB.
- Consultar datos con funciones remotas
- Consultar datos sin estructurar con funciones remotas
- Consulta datos mediante procedimientos almacenados de Apache Spark.
- Consulta información sobre las tablas externas.