Bloques de Looker

Los Looker Blocks son modelos de datos predefinidos para patrones analíticos y fuentes de datos habituales. Reutiliza el trabajo que ya han hecho otros usuarios en lugar de empezar desde cero y, después, personaliza los bloques según tus especificaciones. Desde patrones de SQL optimizados hasta modelos de datos totalmente desarrollados, Looker Blocks se puede usar como punto de partida para modelar datos de forma rápida y flexible en Looker.

Puedes obtener Blocks para personalizar y añadir a tu instancia de Looker desde varias fuentes, entre las que se incluyen las siguientes:

  • Looker Marketplace independiente, donde puedes buscar Blocks y acceder a su código fuente.
  • Looker Marketplace, al que se puede acceder desde tu instancia de Looker. En este Marketplace, puede buscar e instalar Looker Blocks (llamados "modelos") directamente en su instancia de Looker. Consulta la página de documentación Usar Looker Marketplace para obtener más información sobre cómo instalar herramientas de Looker Marketplace.

Tipos de bloques de Looker

Los bloques de Looker ofrecen diversas funciones, como las siguientes:

  • Los bloques de datos, que incluyen tanto conjuntos de datos públicos como modelos de LookML completos, requieren que se copie el modelo de LookML de un repositorio de GitHub para acceder a las tablas modelizadas. Estos bloques no se pueden personalizar. Consulta las instrucciones detalladas en la sección Usar bloques de datos de esta página.

  • Las aplicaciones de recogida de datos, como Segment y Snowplow, registran eventos con un formato relativamente estandarizado. De esta forma, se pueden crear patrones de diseño basados en plantillas, capaces de limpiar, transformar y analizar datos, que pueden usar todos los clientes que utilicen estas aplicaciones.

  • Otras aplicaciones web, como Salesforce, te permiten añadir campos personalizados para tus usuarios internos. Como es lógico, esto genera datos en un formato menos estandarizado. Por lo tanto, podemos crear plantillas de parte del modelo de datos para que las analíticas funcionen, pero tendrás que personalizar la parte no estandarizada.

  • También hay bloques de métricas empresariales generales. Estos bloques son patrones de diseño de SQL u LookML optimizados que son independientes de la fuente de datos. Por ejemplo, muchas empresas querrán analizar el valor del tiempo de vida de un cliente a lo largo del tiempo. Estos patrones se basan en algunas suposiciones, pero se pueden personalizar para que se ajusten a las necesidades específicas de tu empresa. Estos patrones reflejan el punto de vista de Looker sobre la mejor forma de llevar a cabo determinados tipos de análisis.

Puedes consultar los Looker Blocks en el directorio de la instancia pública de Looker Marketplace, disponible en marketplace.looker.com.

Instalar un bloque de Looker

Para instalar un bloque de Looker de Marketplace asociado a tu instancia de Looker, sigue las instrucciones sobre cómo instalar una herramienta de Marketplace.

Para instalar un bloque de Looker desde marketplace.looker.com, sigue las instrucciones del código fuente del bloque.

Cada bloque de Looker tiene instrucciones de uso específicas.

Estandarización y personalización

El grado de personalización que necesite puede depender de lo estandarizado que esté el esquema de su base de datos. La mayoría de los bloques de Looker requieren cierta personalización para adaptarse a su esquema de datos.

Algunos bloques muestran tanto Exploraciones como vistas en el mismo archivo. Esto se hace para que sea más fácil verlos, pero, por lo general, te recomendamos que copies las secciones correspondientes de LookML en los lugares adecuados de tu modelo de datos. Para obtener más información, consulta la página de documentación Tipos de archivos en un proyecto de LookML.

En algunos casos, puede que tengas que crear archivos LookML en tu modelo de datos para alojar los ejemplos.

Usar bloques de datos

Los bloques de datos son un tipo especial de bloque de Looker que proporciona el conjunto de datos y el modelo de datos. Los bloques de datos incluyen fuentes de datos públicas, como las siguientes:

  • Datos demográficos: métricas demográficas comunes de la encuesta American Community Survey a nivel de estado, condado, área de tabulación de códigos postales e incluso de grupo de manzanas censales.
  • Datos meteorológicos: informes meteorológicos de Estados Unidos a nivel de código postal desde 1920 hasta el día anterior. Este bloque se actualiza cada noche.

El procedimiento para acceder al conjunto de datos de un bloque de datos varía en función del esquema de la base de datos. En las siguientes secciones se incluyen instrucciones para acceder a conjuntos de datos en estas bases de datos:

Acceder a conjuntos de datos en Google BigQuery

Si ya tienes una cuenta de Google BigQuery, puedes acceder a los conjuntos de datos alojados en BigQuery de Looker. Ve a la sección Añadir bloques de datos a proyectos de esta página.

Si aún no tienes una cuenta de Google BigQuery, puedes configurar una prueba gratuita y, después, acceder a los conjuntos de datos públicos de Looker en BigQuery.

Acceder a conjuntos de datos de otras bases de datos

Los datos transformados de los conjuntos de datos de Amazon Redshift, MySQL, PostgreSQL u Oracle están disponibles públicamente tanto en el Google Cloud servicio como en S3, por lo que puedes importarlos directamente a la base de datos que elijas.

También hemos puesto a disposición el lenguaje de definición de datos (DDL) para cada uno de los conjuntos de datos del repositorio de GitHub. Es posible que tengas que modificar las instrucciones DDL para los tipos de datos de la base de datos seleccionada, pero deberían darte una idea de los tipos de columna de cada tabla.

Descarga los datos directamente desde una de estas ubicaciones:

Acceder al modelo de LookML

Crea una bifurcación de uno de nuestros repositorios de GitHub en un nuevo repositorio de GitHub (alojado por Looker o por tu empresa) que puedas ampliar o refinar en tu instancia:

Añadir bloques de datos a proyectos

Además del método descrito en esta sección, también puede usar refinamientos de LookML para ampliar el LookML de las vistas y los Exploraciones de sus proyectos.

Para añadir un bloque de datos a tu proyecto, sigue estos pasos:

  1. Añade un proyecto nuevo a tu instancia de Looker.

  2. Crea una bifurcación o copia de los repositorios de GitHub mencionados anteriormente para acceder al LookML prediseñado. Asegúrate de crear un repositorio de GitHub.

  3. Elimina otros archivos de dialecto de base de datos del repositorio. Los bloques de Looker suelen contener archivos de Google BigQuery, Amazon Redshift y Snowflake. Por ejemplo, si está configurando bloques de datos en Google BigQuery, solo necesitará los archivos de vista de Google BigQuery, el archivo de Exploración de Google BigQuery y el archivo de modelo de Google BigQuery.

  4. Sustituye el nombre de la conexión en el archivo de modelo por la conexión de la base de datos en la que se encuentran los datos de los bloques de datos. Si usas Google BigQuery o Snowflake, utiliza la conexión de base de datos desde la que vas a ampliar o refinar.

    Toda la lógica de unión se encuentra en un archivo .explore de cada repositorio. Este es el archivo que incluirás en los pasos siguientes, después de configurar el manifiesto del proyecto.

  5. En el proyecto principal de Looker en el que vayas a ampliar o perfeccionar los bloques de datos, crea un archivo de manifiesto del proyecto.

  6. Añade el siguiente LookML al archivo de manifiesto del proyecto para hacer referencia a los bloques de datos de tu proyecto principal de Looker:

    project_name: "<your_project_name\>"

    local_dependency: {
      project: "<project_name_of_datablock\>"
    }

Consideraciones y opciones de configuración

Google BigQuery: asegúrate de usar el conjunto correcto de archivos modelados. Si usas Google BigQuery, puedes hacer referencia a todos los archivos con _bq_ en el nombre. Es posible que tengas que adaptar nuestros dialectos del modelo de Google BigQuery al dialecto de tu base de datos.

Extensiones: todos nuestros proyectos se han configurado para permitir extensiones de archivos Exploración, ya que las extensiones de modelos podrían causar problemas con varias conexiones.

Unir tablas derivadas: consulta nuestra documentación sobre tablas derivadas nativas. Puedes dejar que Looker escriba código SQL por ti en diferentes niveles de agregación en nuestros conjuntos de datos disponibles públicamente y unirlos a tu modelo.

Combinar conjuntos de resultados: también puedes combinar conjuntos de resultados de nuestros conjuntos de datos con tus datos combinando conjuntos de resultados de consultas.

Ejemplo de configuración del conjunto de datos demográficos

  1. Accede a los datos descargando datos sin procesar de nuestros contenedores de S3 o de Google Cloud servicios, o bien conectándote a una base de datos de Looker.

  2. Importa el modelo Bloque de datos demográficos de LookML como un proyecto independiente en tu instancia de Looker.

  3. Usa el parámetro include para importar el archivo de vista.

  4. A continuación, amplía o refina el archivo de vista, o bien usa tablas derivadas nativas para obtener los datos con el nivel de agregación necesario para los Exploraciones.

    En nuestro ejemplo, como los datos demográficos tienen un nivel de agregación diferente al de nuestro conjunto de datos de comercio electrónico (grupo de manzanas frente a código postal), usamos tablas derivadas integradas para agregar estadísticas hasta el nivel de código postal. De esta forma, se eliminan las uniones de muchos a muchos complejas:

      include: "/american_community_survey/bq.explore"
    
      view: zipcode_income_facts {
        derived_table: {
          persist_for: "10000 hours"
          explore_source: fast_facts {
            column: ZCTA5 { field: tract_zcta_map.ZCTA5 }
            column: income_household { field: bg_facts.avg_income_house }
            column: total_population { field: bg_facts.total_population }
          }
        }
        dimension: ZCTA5 {}
        dimension: income_household {
          hidden: yes
        }
    
  5. Unir los archivos de vista al modelo:

      include: "acs*.view"
    
      explore: order_items {
        join: users {
          sql_on: ${users.id} = ${order_items.user_id} ;;
          type: left_outer
          relationship: many_to_one
        }
    
        join: zipcode_income_facts {
          sql_on: ${users.zip} = ${zipcode_income_facts.ZCTA5} ;;
          type: left_outer
          relationship: many_to_one
        }
      }
    
  6. Explora y visualize los datos.