Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Auf dieser Seite finden Sie Informationen zum Herstellen einer Verbindung zwischen Looker und Apache Spark 3.
Looker stellt über eine JDBC-Verbindung zum Spark Thrift Server eine Verbindung zu Apache Spark 3+ her.
Netzwerk-Datenverkehr verschlüsseln
Es empfiehlt sich, den Netzwerkverkehr zwischen der Looker-Anwendung und Ihrer Datenbank zu verschlüsseln. Prüfen Sie eine der Optionen, die auf der Dokumentationsseite Sicheren Datenbankzugriff ermöglichen beschrieben werden.
Looker-Verbindung zu Ihrer Datenbank erstellen
Wählen Sie in Looker im Bereich Admin die Option Connections (Verbindungen) aus und klicken Sie dann auf Add Connection (Verbindung hinzufügen).
Geben Sie die Verbindungsdetails ein. Der Großteil der Einstellungen gilt für die meisten Datenbankdialekte. Weitere Informationen finden Sie auf der Dokumentationsseite Looker mit Ihrer Datenbank verbinden. Einige der Einstellungen werden im Folgenden beschrieben:
Name: Der Name der Verbindung. So wird in LookML auf die Verbindung verwiesen.
Dialect (Dialekt): Wählen Sie Apache Spark 3+ aus.
Host: Der Host des Thrift-Servers.
Port: Der Thrift-Serverport (standardmäßig 10000).
Datenbank: Das Standardschema bzw. die Standarddatenbank, die modelliert wird. Wenn für eine Tabelle keine Datenbank angegeben ist, wird davon ausgegangen.
Nutzername: Der Nutzer, als der sich Looker authentifizieren wird.
Passwort: Das optionale Passwort für den Looker-Nutzer.
PDTs aktivieren: Mit diesem Schalter können Sie persistente abgeleitete Tabellen aktivieren. Wenn PDTs aktiviert sind, werden im Fenster Verbindung zusätzliche PDT-Einstellungen und der Bereich PDT-Überschreibungen angezeigt.
Temporäre Datenbank: Ein temporäres Schema/eine temporäre Datenbank zum Speichern von PDTs. Sie muss zuvor mit einer Anweisung wie CREATE SCHEMA looker_scratch; erstellt werden.
Zusätzliche JDBC-Parameter: Fügen Sie hier zusätzliche Hive-JDBC-Parameter hinzu, z. B.:
Zeitzone der Datenbank: Die Zeitzone der in Spark gespeicherten Daten. Normalerweise kann es leer gelassen oder auf UTC gesetzt werden.
Zeitzone der Abfrage: Die Zeitzone, in der in Looker abgefragte Daten angezeigt werden.
Klicken Sie auf Test, um zu prüfen, ob die Verbindung erfolgreich hergestellt wurde. Informationen zur Fehlerbehebung finden Sie auf der Dokumentationsseite Datenbankkonnektivität testen.
Klicken Sie auf Verbinden, um diese Einstellungen zu speichern.
Funktionsunterstützung
Damit Looker einige Funktionen unterstützen kann, müssen diese auch von Ihrem Datenbankdialekt unterstützt werden.
Apache Spark 3+
Apache Spark 3+ unterstützt ab Looker 25.14 die folgenden Funktionen:
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-08-18 (UTC)."],[],[],null,["# Apache Spark\n\nThis page contains information about connecting Looker to Apache Spark 3.\n\nLooker connects to Apache Spark 3+ through a JDBC connection to the Spark Thrift Server.\n| **Note:** Looker does not support connections to Apache Spark 1.5 or Apache Spark 2. Queries on connections to Apache Spark 1.5 or Apache Spark 2 will return an error.\n\nEncrypting network traffic\n--------------------------\n\nIt is a best practice to encrypt network traffic between the Looker application and your database. Consider one of the options described on the [Enabling secure database access](/looker/docs/enabling-secure-db-access) documentation page.\n\nCreating the Looker connection to your database\n-----------------------------------------------\n\nIn the **Admin** section of Looker, select **Connections** , and then click **Add Connection**.\n\nFill out the connection details. The majority of the settings are common to most database dialects. See the [Connecting Looker to your database](/looker/docs/connecting-to-your-db) documentation page for information. Some of the settings are described next:\n\n- **Name**: The name of the connection. This is how the connection will be referred to in the LookML model.\n- **Dialect** : Select **Apache Spark 3+**.\n- **Host**: The Thrift server host.\n- **Port** The Thrift server port (10000 by default).\n- **Database**: The default schema/database that will be modeled. When no database is specified for a table, this will be assumed.\n- **Username**: The user that Looker will authenticate as.\n- **Password**: The optional password for Looker user.\n- **Enable PDTs** : Use this toggle to enable [persistent derived tables](/looker/docs/derived-tables#persistent-derived-tables). When PDTs are enabled, the **Connection** window reveals additional PDT settings and the [**PDT Overrides**](/looker/docs/connecting-to-your-db#pdt-overrides) section.\n- **Temp Database** : A temporary schema/database for storing PDTs. It must be created beforehand, with a statement such as `CREATE SCHEMA looker_scratch;`.\n- **Additional JDBC parameters** : Add any additional Hive JDBC parameters here, such as:\n - `;spark.sql.inMemoryColumnarStorage.compressed=true`\n - `;auth=noSasl`\n- **SSL**: Leave this unchecked.\n- **Database Time Zone**: The time zone of data stored in Spark. Usually it can be left blank or set to UTC.\n- **Query Time Zone**: The time zone to display data queried in Looker.\n\nTo verify that the connection is successful, click **Test** . See the [Testing database connectivity](/looker/docs/testing-db-connectivity) documentation page for troubleshooting information.\n\nTo save these settings, click **Connect**.\n\nFeature support\n---------------\n\nFor Looker to support some features, your database dialect must also support them.\n\n### Apache Spark 3+\n\nApache Spark 3+ supports the following features as of Looker 25.14:\n\nNext steps\n----------\n\nAfter you have created the connection, [set authentication options](/looker/docs/getting-started-with-users)."]]