Encriptación del tráfico de red
Se recomienda encriptar el tráfico de red entre la aplicación de Looker y tu base de datos. Considera una de las opciones que se describen en la página de documentación Cómo habilitar el acceso seguro a la base de datos.
Crea un usuario de Looker
Looker se autentica en Databricks con tokens de acceso personal. Sigue la documentación de Databricks para crear un token de acceso personal para que un usuario de Databricks lo use en Looker.
Agrega permisos a este usuario con GRANT
.
Como mínimo, el usuario de Looker debe tener los permisos SELECT
y READ_METADATA
.
GRANT SELECT ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_DATABASE> TO `<looker>@<your.databricks.com>`
Información del servidor
Sigue la documentación de Databricks para encontrar la ruta de acceso HTTP de tu clúster de Databricks. En esta página, se hará referencia a este como <YOUR_HTTP_PATH>
.
Configura tablas derivadas persistentes
Para usar tablas derivadas persistentes, crea una base de datos independiente.
CREATE DATABASE <YOUR_SCRATCH_DATABASE>
También se deberán otorgar permisos de usuario adicionales basados en escritura.
GRANT SELECT CREATE MODIFY ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`
GRANT READ_METADATA ON DATABASE <YOUR_SCRATCH_DATABASE> TO `<looker>@<your.databricks.com>`
Cómo crear la conexión de Looker a tu base de datos
En la sección Administrador de Looker, selecciona Conexiones y, luego, haz clic en Agregar conexión.
Completa los detalles de la conexión. La mayoría de los parámetros de configuración son comunes en la mayoría de los dialectos de bases de datos. Consulta la página de documentación Cómo conectar Looker a tu base de datos para obtener más información. A continuación, se describen algunos de los parámetros de configuración:
- Nombre: Especifica el nombre de la conexión. Así es como te referirás a la conexión en los proyectos de LookML.
- Dialect: Especifica el dialecto Databricks.
- Host: Especifica la URL del espacio de trabajo de Databricks. Por ejemplo,
dbc-xxxxxxxx.cloud.databricks.com/
- Puerto: Especifica el puerto de la base de datos. El valor predeterminado es 443.
- Base de datos: Especifica el nombre de la base de datos que se usará para las consultas de Looker. El valor predeterminado es
default
. - Catalog: Para las bases de datos de Databricks con Unity Catalog habilitado, especifica el nombre del catálogo que se usará para las consultas de Looker. Si no especificas un catálogo, Looker solo accederá a los esquemas del catálogo predeterminado. Consulta Funcionalidad de Looker con Databricks Unity Catalog para obtener más información.
- Autenticación: Selecciona Cuenta de base de datos o OAuth:
- Usa Database Account para especificar un token de acceso personal de Databricks que se usará para conectarse a Looker (consulta la sección Crea un usuario de Looker para obtener instrucciones).
- En Nombre de usuario, ingresa el valor
token
(no ingreses el correo electrónico del usuario de Databricks en este campo). - En Contraseña, ingresa el token de acceso personal de Databricks.
- En Nombre de usuario, ingresa el valor
- Usa OAuth para configurar OAuth para la conexión. Consulta la sección Configura OAuth para las conexiones de Databricks para obtener más información.
- Usa Database Account para especificar un token de acceso personal de Databricks que se usará para conectarse a Looker (consulta la sección Crea un usuario de Looker para obtener instrucciones).
- Habilitar PDT: Usa este botón de activación para habilitar las tablas derivadas persistentes. Cuando los PDT están habilitados, la ventana Connection revela parámetros de configuración adicionales de PDT y la sección PDT Overrides. Nota: Las PDT no son compatibles con las conexiones de Databricks que usan OAuth.
- Base de datos temporal: Ingresa la base de datos que deseas usar para almacenar los PDT.
- Cantidad máxima de conexiones del compilador de PDT: Especifica la cantidad de compilaciones de PDT simultáneas posibles en esta conexión. Si se establece un valor demasiado alto, se podría afectar negativamente los tiempos de consulta. Para obtener más información, consulta la página de documentación Conecta Looker a tu base de datos.
Parámetros adicionales de JDBC: Agrega los parámetros de JDBC de Spark adicionales que desees.
Programa de mantenimiento: Es una expresión
cron
que indica cuándo debe verificar Looker los grupos de datos y las tablas derivadas persistentes. Obtén más información sobre este parámetro de configuración en la documentación de Programa de mantenimiento.SSL: Marca esta opción para usar conexiones SSL.
Verificar SSL: Marca esta opción para aplicar la verificación estricta del certificado SSL.
Max connections per node: Inicialmente, puedes dejar este parámetro de configuración en el valor predeterminado. Obtén más información sobre este parámetro de configuración en la sección Max connections per node de la página de documentación Cómo conectar Looker a tu base de datos.
Tiempo de espera del grupo de conexiones: Inicialmente, puedes dejar este parámetro de configuración en el valor predeterminado. Obtén más información sobre este parámetro de configuración en la sección Tiempo de espera del grupo de conexiones de la página de documentación Conecta Looker a tu base de datos.
Almacenamiento previo en caché del Ejecutor de SQL: Desmarca esta casilla de verificación para que el Ejecutor de SQL no precargue la información de la tabla y la cargue solo cuando se seleccione una tabla. Obtén más información sobre este parámetro de configuración en la sección SQL Runner Precache de la página de documentación Cómo conectar Looker a tu base de datos.
Zona horaria de la base de datos: Especifica la zona horaria que se usará en la base de datos. Deja este campo en blanco si no deseas la conversión de zona horaria. Consulta la página de documentación Cómo usar la configuración de zona horaria para obtener más información.
Haz clic en Probar para probar la conexión y asegurarte de que esté configurada correctamente. Si ves Se puede conectar, presiona Conectar. Esto ejecuta el resto de las pruebas de conexión para verificar que la cuenta de servicio se haya configurado correctamente y con los roles adecuados. Consulta la página de documentación Prueba la conectividad de la base de datos para obtener información sobre la solución de problemas.
Funcionalidad de Looker con Databricks Unity Catalog
Looker admite conexiones a bases de datos de Databricks con Unity Catalog habilitado. Puedes especificar el nombre del catálogo en el campo Catálogo de la ventana Conexión de Looker cuando crees una conexión de Looker a tu base de datos o cuando edites una conexión de Looker existente a una base de datos de Databricks.
Si tu base de datos de Databricks está habilitada para Unity Catalog, puedes especificar un catálogo de Databricks en el campo Catálogo de la conexión de Looker. Cuando especificas un catálogo de Databricks, Looker lo usa en las siguientes situaciones:
- Cuando generes un nuevo proyecto de LookML a partir de tu base de datos, Looker creará los archivos del proyecto en función de las tablas del catálogo configurado de tu conexión.
- En el caso de los proyectos existentes, cuando uses el IDE de Looker para crear una vista a partir de una tabla, Looker creará archivos de vista solo a partir de las tablas del catálogo configurado de tu conexión.
- Cuando usas SQL Runner, solo puedes seleccionar esquemas del catálogo configurado de tu conexión.
Si tu base de datos de Databricks está habilitada para Unity Catalog y la conexión de Looker no tiene un valor en el campo Catálogo, la mayoría de las funciones de Looker accederán a los esquemas solo desde el catálogo predeterminado, como en los siguientes casos:
- Cuando generes un proyecto de LookML nuevo a partir de tu base de datos, Looker creará los archivos del proyecto en función de las tablas del catálogo predeterminado de Unity Catalog.
- En el caso de los proyectos existentes, cuando se usa el IDE de Looker para crear una vista a partir de una tabla, Looker solo puede crear archivos de vista a partir de las tablas del catálogo predeterminado de Unity Catalog.
- Cuando usas el Ejecutor de SQL, solo puedes seleccionar esquemas del catálogo predeterminado de Unity Catalog.
Cómo configurar OAuth para conexiones de Databricks
Looker admite OAuth para las conexiones de Databricks, lo que significa que cada usuario de Looker se autentica en la base de datos y autoriza a Looker a ejecutar consultas en la base de datos con su propia cuenta de usuario de OAuth.
OAuth permite a los administradores de bases de datos realizar las siguientes tareas:
- Audita qué usuarios de Looker ejecutan consultas en la base de datos
- Aplica controles de acceso basados en roles con permisos a nivel de la base de datos
- Usa tokens de OAuth para todos los procesos y acciones que accedan a la base de datos, en lugar de incorporar IDs y contraseñas de la base de datos en varios lugares.
- Revoca la autorización de un usuario determinado directamente a través de la base de datos
Con las conexiones de Databricks que usan OAuth, los usuarios deben volver a acceder periódicamente cuando vencen sus tokens de OAuth.
Ten en cuenta lo siguiente para las conexiones de OAuth a nivel de la base de datos:
- Si un usuario permite que venza su token de OAuth, se verán afectados todos los programas o alertas de Looker que le pertenezcan. Para evitar esto, Looker enviará un correo electrónico de notificación al propietario de cada programación y cada alerta antes de que venza el token de OAuth activo actual. Looker enviará estos correos electrónicos de notificación 14, 7 y 1 día antes de que venza el token. El usuario puede ir a su página de usuario de Looker para volver a autorizar el acceso de Looker a la base de datos y evitar interrupciones en sus programas y alertas. Consulta la página de documentación Personaliza la configuración de la cuenta de usuario para obtener más detalles.
- Dado que las conexiones de bases de datos que usan OAuth son "por usuario", las políticas de almacenamiento en caché también son por usuario y no solo por consulta. Esto significa que, en lugar de usar los resultados almacenados en caché cada vez que se ejecute la misma consulta dentro del período de almacenamiento en caché, Looker usará los resultados almacenados en caché solo si el mismo usuario ejecutó la misma consulta dentro del período de almacenamiento en caché. Para obtener más información sobre el almacenamiento en caché, consulta la página de documentación Almacenamiento en caché de consultas.
- Las tablas derivadas persistentes (PDT) no son compatibles con las conexiones de Databricks con OAuth.
- Cuando un administrador de Looker usa sudo como otro usuario, el administrador usará el token de acceso de OAuth de ese usuario. Si el token de acceso del usuario caducó, el administrador no puede crear un token nuevo en nombre del usuario con privilegios de sudo. Consulta la página de documentación de Usuarios para obtener información sobre el uso del comando
sudo
. - Cuando un usuario accede a Databricks desde Looker con OAuth, Looker no muestra un cuadro de diálogo de consentimiento explícito del usuario. Si configuras OAuth con Looker, das tu consentimiento implícito para que tu instancia de Looker acceda a tu base de datos de Databricks.
- Para usar OAuth en una conexión de Databricks, debes tener usuarios o principales de servicio de Databricks que se puedan usar para las consultas de Looker, y debes proporcionar a los usuarios y a los principales de servicio los permisos de Databricks que Looker necesitará para acceder a las fuentes de datos y realizar las acciones requeridas en Databricks.
Para crear una conexión de Databricks a Looker con OAuth, debes realizar estos pasos generales, que se detallan en las siguientes secciones:
Habilita una aplicación de OAuth personalizada en Databricks
Para usar OAuth en una conexión de Looker a Databricks, debes habilitar Looker como una aplicación de OAuth personalizada para tu base de datos de Databricks. Para ello, sigue estos pasos:
- Accede a la consola de la cuenta de Databricks.
- Haz clic en el ícono de Configuración en el panel lateral.
- Haz clic en la pestaña Conexiones de la app en la ventana Configuración.
- En la pestaña Conexiones de la app, haz clic en Agregar conexión.
Ingresa los siguientes valores en el diálogo Agregar conexión de Databricks:
- Nombre de la aplicación: Proporciona un nombre descriptivo, como "Integración de Looker".
URLs de redireccionamiento: Ingresa la URL de Looker a la que Databricks redireccionará a los usuarios después de la autorización exitosa con este formato (reemplaza
example.looker.com
por la URL de tu instancia de Looker):https://example.looker.com/external_oauth/redirect
Alcances de acceso: Selecciona SQL para permitir que Looker consulte datos a través de SQL.
Genera un secreto del cliente: Habilita esta opción.
Haz clic en Agregar en el diálogo Agregar conexión de Databricks.
Copia y almacena de forma segura el ID de cliente y el secreto del cliente que genera Databricks.
El registro de una aplicación de OAuth puede tardar hasta 30 minutos en procesarse en la base de datos de Databricks. Para obtener más información, consulta la documentación oficial de Databricks.
Configura la conexión en Looker
Después de configurar Looker como una aplicación de OAuth personalizada en tu base de datos de Databricks, puedes configurar una conexión de Looker a Databricks que use OAuth.
- En la sección Administrador de Looker, selecciona Conexiones y, luego, haz clic en Agregar conexión.
- Completa los detalles de la conexión, como se describe en la sección Cómo crear la conexión de Looker a tu base de datos de esta página.
- Selecciona la opción OAuth en el campo Autenticación.
- Cuando seleccionas la opción OAuth, Looker muestra los campos ID de cliente de OAuth y Secreto de cliente de OAuth. Para estos valores, ingresa el ID de cliente y el secreto de cliente que generó Databricks cuando habilitaste Looker como una aplicación de OAuth personalizada en Databricks.
- Selecciona el botón Probar en la parte inferior de la página Configuración de conexiones para asegurarte de que Looker pueda establecer correctamente el flujo de OAuth y conectarse a tu instancia de Databricks.
Compatibilidad de características
Para que Looker admita algunas funciones, tu dialecto de base de datos también debe admitirlas.
A partir de Looker 25.10, Databricks admite las siguientes funciones:
Función | ¿Es compatible? |
---|---|
Nivel de asistencia | Admitido |
Looker (Google Cloud Core) | Sí |
Agregaciones simétricas | Sí |
Tablas derivadas | Sí |
Tablas derivadas persistentes basadas en SQL | Sí |
Tablas derivadas persistentes nativas | Sí |
Vistas estables | Sí |
Cancelación de consultas | Sí |
Tablas dinámicas basadas en SQL | Sí |
Zonas horarias | Sí |
SSL | Sí |
Subtotales | Sí |
Parámetros adicionales de JDBC | Sí |
Distinción entre mayúsculas y minúsculas | Sí |
Tipo de ubicación | Sí |
Tipo de lista | Sí |
Percentil | Sí |
Percentil de valores distintos | No |
Ejecutor de SQL: Mostrar procesos | No |
Ejecutor de SQL: Describe la tabla | Sí |
Ejecutor de SQL: Mostrar índices | No |
Seleccionar 10 en el Ejecutor de SQL | Sí |
Recuento del Ejecutor de SQL | Sí |
Explicación de SQL | Sí |
Credenciales de OAuth 2.0 | Sí |
Comentarios contextuales | Sí |
Agrupación de conexiones | No |
Esbozos de HLL | No |
Conocimiento total | Sí |
PDT incrementales | Sí |
Milisegundos | Sí |
Microsegundos | Sí |
Vistas materializadas | No |
Medidas de comparación entre períodos | No |
Distinción de recuento aproximado | No |