Questa pagina è stata tradotta dall'API Cloud Translation.

Apache Spark

Questa pagina contiene informazioni sulla connessione di Looker ad Apache Spark 3.

Looker si connette ad Apache Spark 3+ tramite una connessione JDBC a Spark Thrift Server.

Crittografia del traffico di rete

È una best practice criptare il traffico di rete tra l'applicazione Looker e il tuo database. Valuta una delle opzioni descritte nella pagina della documentazione Abilita l'accesso sicuro ai database.

Creazione della connessione Looker al tuo database

Nella sezione Amministrazione di Looker, seleziona Connessioni e poi fai clic su Aggiungi connessione.

Compila i dettagli della connessione. La maggior parte delle impostazioni è comune alla maggioranza dei dialetti di database. Per informazioni, consulta la pagina della documentazione Connessione di Looker al tuo database. Di seguito sono descritte alcune impostazioni:

Nome: il nome della connessione. Questo è il modo in cui verrà fatto riferimento alla connessione nel modello LookML.
Dialetto: seleziona Apache Spark 3+.
Host: l'host del server Thrift.
Porta: la porta del server Thrift (10000 per impostazione predefinita).
Database: lo schema/database predefinito che verrà modellato. Quando non viene specificato alcun database per una tabella, questo valore verrà utilizzato.
Nome utente: l'utente per cui Looker eseguirà l'autenticazione.
Password: la password facoltativa per l'utente Looker.
Abilita PDT: utilizza questo pulsante di attivazione/disattivazione per abilitare le tabelle derivate permanenti. Quando le PDT sono abilitate, la finestra Connessione mostra impostazioni PDT aggiuntive e la sezione Override PDT.
Database temporaneo: uno schema/database temporaneo per l'archiviazione delle PDT. Deve essere creato in anticipo, con una dichiarazione come CREATE SCHEMA looker_scratch;.
Parametri JDBC aggiuntivi: aggiungi qui eventuali parametri JDBC Hive aggiuntivi, ad esempio:
- ;spark.sql.inMemoryColumnarStorage.compressed=true
- ;auth=noSasl
SSL: lascia questa opzione deselezionata.
Fuso orario database: il fuso orario dei dati archiviati in Spark. In genere, questo campo può essere lasciato vuoto o impostato su UTC.
Fuso orario query: il fuso orario in cui visualizzare i dati sottoposti a query in Looker.

Per verificare che la connessione sia riuscita, fai clic su Testa. Per informazioni sulla risoluzione dei problemi, consulta la pagina della documentazione Testare la connettività del database.

Per salvare queste impostazioni, fai clic su Connetti.

Funzionalità supportate

Affinché Looker supporti alcune funzionalità, anche il dialetto del database deve supportarle.

Apache Spark 3+

A partire da Looker 25.18, Apache Spark 3+ supporta le seguenti funzionalità:

Funzionalità	Supportata?
Livello di assistenza	Sì
Looker (Google Cloud core)	Sì
Aggregati simmetrici	Sì
Tabelle derivate	Sì
Tabelle derivate permanenti basate su SQL	Sì
Tabelle derivate permanenti native	Sì
Visualizzazioni stabili	Sì
Interruzione delle query	Sì
Pivot basati su SQL	Sì
Fusi orari	Sì
SSL	Sì
Subtotali	Sì
Parametri JDBC aggiuntivi	Sì
Sensibile alle maiuscole	Sì
Tipo di località	Sì
Tipo di elenco	Sì
Percentile	Sì
Percentile valori distinti	No
SQL Runner Show Processes	No
SQL Runner Describe Table	Sì
SQL Runner Show Indexes	No
SQL Runner Select 10	Sì
SQL Runner Count	Sì
SQL Explain	Sì
Credenziali OAuth 2.0	No
Commenti contestuali	Sì
Pool di connessioni	No
Schizzi HLL	No
Riconoscimento degli aggregati	Sì
PDT incrementali	No
Millisecondi	Sì
Microsecondi	Sì
Viste materializzate	No
Misure in base al periodo	No
Conteggio approssimativo dei valori distinti	No

Passaggi successivi

Dopo aver creato la connessione, imposta le opzioni di autenticazione.