Conéctate a Spanner
Como administrador de BigQuery, puedes crear una conexión para acceder a los datos de Spanner. Esta conexión permite que los analistas de datos consulten datos en Spanner.
Antes de comenzar
- Habilita la API de conexión de BigQuery
-
Para obtener los permisos que necesitas para conectarte a Spanner, solicita a tu administrador que te otorgue el rol de IAM Administrador de conexión de BigQuery (
roles/bigquery.connectionAdmin
) en el proyecto. Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.
Crea conexiones de Spanner
Selecciona una de las opciones siguientes:
Console
Ve a la página de BigQuery.
En el panel Explorador, haz clic en
Agregar y, luego, selecciona Conexiones a fuentes de datos externas.En el panel Fuente de datos externa, ingresa la siguiente información:
- En Connection type (Tipo de conexión), selecciona Cloud Spanner.
- En ID de conexión, ingresa un identificador para el recurso de conexión. Se permiten letras, números y guiones bajos.
- En Tipo de ubicación, selecciona una ubicación (o región) de BigQuery que sea compatible con la región de la fuente de datos externa.
- En Nombre descriptivo (Friendly name), ingresa un nombre fácil de usar para la conexión, como
My connection resource
(opcional). El nombre descriptivo puede ser cualquier valor que te ayude a identificar el recurso de conexión si necesitas modificarlo más adelante. - En Descripción, ingresa una descripción para este recurso de conexión (opcional).
- En Nombre de la base de datos, ingresa el nombre de la base de datos de Spanner en el siguiente formato:
"projects/PROJECT_ID/instances/INSTANCE/databases/DATABASE"
- Para realizar lecturas paralelas, selecciona Leer datos en paralelo (opcional). Spanner puede dividir determinadas consultas en partes más pequeñas, o particiones, y recuperar las particiones en paralelo. Para obtener más información, consulta Lee datos en paralelo en la documentación de Spanner. Esta opción está restringida a consultas cuyo primer operador en el plan de ejecución sea un operador de unión distribuida. Otras consultas muestran un error. A fin de ver el plan de ejecución de consultas para una consulta de Spanner, revisa Comprende cómo Spanner ejecuta consultas.
- En Rol de la base de datos, ingresa el nombre de una función de base de datos de Spanner (opcional). Si no está vacío, esta conexión consulta a Spanner mediante esta función de base de datos de forma predeterminada. Los usuarios del control de acceso detallado de Spanner que envían consultas a través de esta conexión deben tener el acceso a este rol por su administrador, y la función de base de datos debe tener el privilegio
SELECT
en todos los objetos de esquema especificados en consultas externas. Para obtener información sobre el control de acceso detallado, consulta Información sobre el control de acceso detallado. - Opcional: Para habilitar Data Boost, selecciona Usar Data Boost de Spanner. Data Boost te permite ejecutar consultas de estadísticas y exportaciones de datos con un impacto casi nulo en las cargas de trabajo existentes de la instancia de BigQuery aprovisionada. Para habilitar el boosting de datos, selecciona Data Boost y Leer datos en paralelo.
Haz clic en Crear conexión (Create connection).
bq
Para crear la conexión, usa el comando bq mk
con la marca --connection
.
bq mk --connection \ --connection_type=CLOUD_SPANNER \ --properties='PROPERTIES' \ --location=LOCATION \ --display_name='FRIENDLY_NAME' \ --description 'DESCRIPTION' \ CONNECTION_ID
Reemplaza lo siguiente:
PROPERTIES
es un objeto JSON con los siguientes campos:"database"
es la base de datos de Spanner para la conexión.Especifica el valor como una string con el siguiente formato:
"projects/PROJECT_ID/instances/INSTANCE/databases/DATABASE"
."use_parallelism"
es opcional sitrue
. Esta conexión realiza lecturas paralelas.El valor predeterminado es
false
. Spanner puede dividir determinadas consultas en partes más pequeñas, o particiones, y recuperar las particiones en paralelo. Para obtener más información, consulta Lee datos en paralelo en la documentación de Spanner. Esta opción está restringida a consultas cuyo primer operador en el plan de ejecución sea un operador de unión distribuida. Otras consultas muestran un error. A fin de ver el plan de ejecución de consultas para una consulta de Spanner, revisa Comprende cómo Spanner ejecuta consultas."database_role"
: Si no está vacío, esta conexión consulta Spanner mediante este rol de base de datos (opcional). Los usuarios del control de acceso detallado de Spanner que envían consultas a través de esta conexión deben tener el acceso a este rol por su administrador, y la función de base de datos debe tener el privilegioSELECT
en todos los objetos de esquema especificados en consultas externas.Si no se especifica, la conexión se autentica con las funciones predefinidas de IAM para Spanner, y se debe haber otorgado la función de IAM
roles/spanner.databaseReader
al principal que ejecuta consultas con esta conexión.Para obtener información sobre el control de acceso detallado, consulta Información sobre el control de acceso detallado.
"useDataBoost"
: (Opcional) Si estrue
, esta conexión permite que los usuarios usen Data Boost. Data Boost permite a los usuarios ejecutar consultas federadas en una capacidad de procesamiento independiente y separada de las instancias aprovisionadas para evitar afectar las cargas de trabajo existentes. Para habilitar Data Boost, establece"useDataBoost"
entrue
y"use_parallelism"
entrue
.Para usar el aumento de datos, se debe haber otorgado el permiso
spanner.databases.useDataBoost
al principal que ejecuta consultas con esta conexión. Este permiso se incluye de forma predeterminada en los rolesroles/spanner.admin
yroles/spanner.databaseAdmin
.
LOCATION
es una ubicación de BigQuery que sea compatible con la región de fuente de datos externaCONNECTION_ID
es un identificador para el recurso de conexión.El ID de conexión puede contener letras, números y guiones bajos. Si no proporcionas un ID de conexión, BigQuery genera de forma automática un ID único.
En el siguiente ejemplo, se crea un recurso de conexión nuevo llamado
my_connection_id
.bq mk --connection \ --connection_type='CLOUD_SPANNER' \ --properties='{"database":"projects/my_project/instances/my_instance/databases/database1"}' \ --project_id=federation-test \ --location=us \ my_connection_id
API
Llama al método CreateConnection
dentro del servicio ConnectionService
.
Comparte conexiones con usuarios
Puedes otorgar los siguientes roles para permitir que los usuarios consulten datos y administren conexiones:
roles/bigquery.connectionUser
: Permite que los usuarios usen conexiones para conectarse con fuentes de datos externas y ejecutar consultas en ellas.roles/bigquery.connectionAdmin
: Permite que los usuarios administren conexiones.
Para obtener más información sobre los roles y los permisos de IAM en BigQuery, consulta Roles y permisos predefinidos.
Selecciona una de las opciones siguientes:
Console
Ve a la página de BigQuery.
Las conexiones se enumeran en tu proyecto, en un grupo llamado Conexiones externas.
En el panel Explorador, haz clic en el nombre de tu proyecto > Conexiones externas > conexión.
En el panel Detalles, haz clic en Compartir para compartir una conexión. A continuación, sigue estos pasos:
En el cuadro de diálogo Permisos de conexión, agrega o edita las principales para compartir la conexión con otros principales.
Haz clic en Guardar.
bq
No puedes compartir una conexión con la herramienta de línea de comandos de bq. Para compartir una conexión, usa la consola de Google Cloud o el método de la API de conexiones de BigQuery.
API
Consulta el método projects.locations.connections.setIAM
en la sección de referencia de la API de REST de las conexiones de BigQuery y proporciona una instancia del recurso policy
.
Java
Antes de probar este ejemplo, sigue las instrucciones de configuración para Java incluidas en la guía de inicio rápido de BigQuery sobre cómo usar bibliotecas cliente. Para obtener más información, consulta la documentación de referencia de la API de BigQuery para Java.
Para autenticarte en BigQuery, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para bibliotecas cliente.
¿Qué sigue?
- Obtén información sobre los diferentes tipos de conexión.
- Obtén más información sobre cómo administrar conexiones.
- Obtén más información sobre consultas federadas.
- Obtén información sobre cómo consultar los datos de Spanner.