Looker-Blöcke sind vorgefertigte Datenmodelle für gängige Analysemuster und Datenquellen. Profitieren Sie von der Arbeit, die wir bereits für Sie erledigt haben, und passen Sie die Blocks anschließend exakt an Ihre Spezifikationen an. Von optimierten SQL-Mustern bis hin zu voll ausgereiften Datenmodellen – Looker Blocks können als Ausgangspunkt für eine schnelle und flexible Datenmodellierung in Looker verwendet werden.
Sie können Blocks aus verschiedenen Quellen beziehen, um sie anzupassen und Ihrer Looker-Instanz hinzuzufügen. Dazu gehören:
- Der eigenständige Looker Marketplace, in dem Sie nach Blocks suchen und auf deren Quellcode zugreifen können.
- Der Looker Marketplace, auf den Sie über Ihre Looker-Instanz zugreifen können. In diesem Marketplace können Sie Looker Blocks – sogenannte „Modelle“ – direkt in Ihrer Looker-Instanz suchen und installieren. Weitere Informationen zum Installieren von Tools aus dem Looker Marketplace finden Sie auf der Dokumentationsseite Looker Marketplace verwenden.
Arten von Looker Blocks
Looker-Blöcke bieten eine Vielzahl von Funktionen, z. B.:
Für Datenblöcke, die sowohl öffentliche Datasets als auch vollständige LookML-Modelle enthalten, muss das LookML-Modell aus einem GitHub-Repository kopiert werden, um auf die modellierten Tabellen zuzugreifen. Diese Blöcke lassen sich nicht anpassen. Eine detaillierte Anleitung finden Sie auf dieser Seite unter Datenblöcke verwenden.
Datenerfassungsanwendungen wie Segment und Snowplow erfassen Ereignisse in einem relativ standardisierten Format. So lassen sich Vorlagen für Designmuster erstellen, die Datenbereinigung, ‑transformation und ‑analyse ermöglichen und von jedem Kunden verwendet werden können, der diese Anwendungen nutzt.
In anderen Webanwendungen wie Salesforce können Sie benutzerdefinierte Felder für Ihre internen Nutzer hinzufügen. Dadurch werden Daten in einem weniger standardisierten Format erstellt. Daher können wir einen Teil des Datenmodells als Vorlage verwenden, um die Analyse zu starten. Sie müssen jedoch den nicht standardisierten Teil anpassen.
Es gibt auch Blöcke für allgemeine Unternehmensstatistiken. Diese Blöcke sind optimierte SQL- oder LookML-Entwurfsmuster, die unabhängig von der Datenquelle sind. Viele Unternehmen möchten beispielsweise den Lifetime-Wert eines Kunden im Zeitverlauf analysieren. Diesen Mustern liegen einige Annahmen zugrunde, sie können aber an Ihre spezifischen Geschäftsanforderungen angepasst werden. Diese Muster spiegeln die Sichtweise von Looker auf die beste Art und Weise wider, bestimmte Arten von Analysen durchzuführen.
Looker-Blöcke können im Verzeichnis der öffentlichen Instanz des Looker Marketplace unter marketplace.looker.com
durchsucht werden.
Looker Block installieren
Wenn Sie einen Looker Block aus dem Marketplace installieren möchten, der mit Ihrer Looker-Instanz verknüpft ist, folgen Sie der Anleitung zum Installieren eines Tools aus dem Marketplace.
Wenn Sie einen Looker-Block aus marketplace.looker.com
installieren möchten, folgen Sie der Anleitung im Quellcode des Blocks.
Für jeden Looker-Block gibt es eine eigene Anleitung.
Standardisierung und Anpassung
Wie stark Sie Ihren Block anpassen müssen, hängt davon ab, wie standardisiert Ihr Datenbankschema ist. Für die meisten Looker-Blöcke sind Anpassungen an Ihr Datenschema erforderlich.
In einigen Blöcken werden sowohl Explores als auch Ansichten in derselben Datei gezeigt. Das dient der Übersichtlichkeit. Im Allgemeinen sollten Sie die entsprechenden LookML-Abschnitte an die entsprechenden Stellen in Ihrem Datenmodell kopieren. Weitere Informationen finden Sie auf der Dokumentationsseite Dateitypen in einem LookML-Projekt.
In einigen Fällen müssen Sie möglicherweise neue LookML-Dateien in Ihrem Datenmodell erstellen, um die Beispiele zu speichern.
Datenblöcke verwenden
Datenblöcke sind eine spezielle Art von Looker-Block, die das Dataset sowie das Datenmodell bereitstellen. Datenblöcke enthalten öffentliche Datenquellen wie:
- Demografische Daten: Gängige demografische Messwerte aus der American Community Survey auf Bundesstaats-, County-, ZCTA- und sogar Census Block Group-Ebene.
- Wetterdaten: Wetterberichte für die USA nach Postleitzahlengebiet von 1920 bis zum Vortag. Dieser Block wird jede Nacht aktualisiert.
Die Vorgehensweise für den Zugriff auf das Dataset eines Datenblocks hängt von Ihrem Datenbankschema ab. In den folgenden Abschnitten finden Sie Anleitungen für den Zugriff auf Datasets in diesen Datenbanken:
Auf Datasets in Google BigQuery zugreifen
Wenn Sie ein vorhandenes Google BigQuery-Konto haben, können Sie auf die in BigQuery gehosteten Datasets von Looker zugreifen. Fahren Sie auf dieser Seite mit dem Abschnitt Datenblöcke zu Projekten hinzufügen fort.
Wenn Sie noch kein Google BigQuery-Konto haben, können Sie eine kostenlose Testversion einrichten und dann auf die öffentlichen Datasets von Looker in BigQuery zugreifen.
Auf Datasets in anderen Datenbanken zugreifen
Transformierte Daten für Amazon Redshift-, MySQL-, PostgreSQL- oder Oracle-Datasets sind sowohl in Google Cloud Service als auch in S3 öffentlich verfügbar, sodass Sie sie direkt in die Datenbank Ihrer Wahl importieren können.
Außerdem haben wir die DDL (Data Definition Language, Datendefinitionssprache) für jedes der Datasets im GitHub-Repository verfügbar gemacht. Die DDL-Anweisungen müssen möglicherweise für die Datentypen in der ausgewählten Datenbank geändert werden, sollten aber eine Vorstellung der Spaltentypen für jede Tabelle vermitteln.
Sie können Daten direkt von einem dieser Orte herunterladen:
- Google Cloud Dienst:
_gs://looker-datablocks/_
- S3:
_s3://looker-datablocks/_
- Weblink für S3-Bucket: http://looker-datablocks.s3-website-us-east-1.amazonaws.com/
Auf das LookML-Modell zugreifen
Erstellen Sie eine Verzweigung eines unserer GitHub-Repositories in ein neues GitHub-Repository (entweder von Looker oder von Ihrem Unternehmen gehostet), das Sie dann in Ihrer Instanz erweitern oder optimieren können:
- Demografische Daten (American Community Survey): https://github.com/llooker/datablocks-acs
- Wetter (GSOD): https://github.com/llooker/datablocks-gsod
Projekten Datenblöcke hinzufügen
Zusätzlich zur in diesem Abschnitt beschriebenen Methode können Sie auch LookML-Verfeinerungen verwenden, um die LookML von Ansichten und Explores in Ihren Projekten zu erweitern.
So fügen Sie Ihrem Projekt einen Datenblock hinzu:
Verzweigen Sie die zuvor erwähnten GitHub-Repositories oder kopieren Sie sie, um auf vorgefertigtes LookML zuzugreifen. Erstellen Sie unbedingt ein neues GitHub-Repository.
Entfernen Sie andere Datenbankdialektdateien aus dem Repository. Looker-Blöcke enthalten in der Regel Dateien für Google BigQuery, Amazon Redshift und Snowflake. Wenn Sie beispielsweise Datenblöcke in Google BigQuery einrichten, benötigen Sie nur die Google BigQuery-Ansichtsdateien, die Google BigQuery-Explore-Datei und die Google BigQuery-Modelldatei.
Ersetzen Sie den Verbindungsnamen in Ihrer Modelldatei durch Ihre Datenbankverbindung, in der sich die Daten für Datenblöcke befinden. Wenn Sie Google BigQuery oder Snowflake verwenden, nutzen Sie die Datenbankverbindung, die Sie erweitern oder optimieren möchten.
Die gesamte Join-Logik ist in einer
.explore
-Datei in jedem der Repositories enthalten. Diese Datei fügen Sie in den folgenden Schritten ein, nachdem Sie Ihr Projektmanifest eingerichtet haben.Erstellen Sie eine Projektmanifestdatei in Ihrem Haupt-Looker-Projekt, in dem Sie Datenblöcke erweitern oder optimieren möchten.
Fügen Sie der Projektmanifestdatei die folgende LookML hinzu, um in Ihrem Haupt-Looker-Projekt auf Datenblöcke zu verweisen:
project_name: "<your_project_name\>"
local_dependency: {
project: "<project_name_of_datablock\>"
}
Überlegungen und Optionen für die Einrichtung
Google BigQuery: Achten Sie darauf, dass Sie die richtigen modellierten Dateien verwenden. Wenn Sie Google BigQuery verwenden, sollten Sie alle Dateien mit _bq_
im Dateinamen referenzieren. Möglicherweise müssen Sie unsere Google BigQuery-Modelldialekte an Ihren eigenen Datenbankdialekt anpassen.
Erweiterungen: Alle unsere Projekte sind so eingerichtet, dass Erweiterungen aus Explore-Dateien möglich sind, da Modellerweiterungen Probleme mit mehreren Verbindungen verursachen können.
Abgeleitete Tabellen verknüpfen: Möglicherweise möchten Sie sich unsere Dokumentation zu nativen abgeleiteten Tabellen ansehen. Sie können Looker SQL-Code für verschiedene Aggregationsebenen für unsere öffentlich verfügbaren Datasets schreiben lassen und diese in Ihr Modell einfügen.
Zusammenführen von Ergebnismengen: Sie können auch Ergebnismengen aus unseren Datasets mit Ihren Daten zusammenführen, indem Sie Abfrageergebnismengen kombinieren.
Beispiel für die Einrichtung des demografischen Datasets
Sie können auf Daten zugreifen, indem Sie Rohdaten aus unseren S3- oder Google Cloud Service-Buckets herunterladen oder eine Verbindung zu einer Looker-Datenbank herstellen.
Importieren Sie das Modell Demographic Data Block aus LookML als separates Projekt in Ihre Looker-Instanz.
Verwenden Sie den Parameter
include
, um die Ansichtsdatei einzubinden.Erweitern oder optimieren Sie dann die Ansichtsdatei oder verwenden Sie native abgeleitete Tabellen, um Daten auf der für Explores erforderlichen Aggregationsebene abzurufen.
Da die demografischen Daten in unserem Beispiel auf einer anderen Aggregationsebene als unser E-Commerce-Dataset vorliegen (Blockgruppe im Vergleich zu Postleitzahl), verwenden wir integrierte abgeleitete Tabellen, um Statistiken auf Postleitzahlebene zu aggregieren. So werden unübersichtliche n:n-Joins vermieden:
include: "/american_community_survey/bq.explore" view: zipcode_income_facts { derived_table: { persist_for: "10000 hours" explore_source: fast_facts { column: ZCTA5 { field: tract_zcta_map.ZCTA5 } column: income_household { field: bg_facts.avg_income_house } column: total_population { field: bg_facts.total_population } } } dimension: ZCTA5 {} dimension: income_household { hidden: yes }
Ansichtsdateien in das Modell einfügen:
include: "acs*.view" explore: order_items { join: users { sql_on: ${users.id} = ${order_items.user_id} ;; type: left_outer relationship: many_to_one } join: zipcode_income_facts { sql_on: ${users.zip} = ${zipcode_income_facts.ZCTA5} ;; type: left_outer relationship: many_to_one } }
Analysieren und visualisieren Sie die Daten.