Nesta página, você encontra informações sobre como conectar o Looker ao Apache Spark 3.
O Looker se conecta ao Apache Spark 3+ por uma conexão JDBC com o Spark Thrift Server.
Como criptografar o tráfego de rede
É uma prática recomendada criptografar o tráfego de rede entre o aplicativo Looker e seu banco de dados. Considere uma das opções descritas na página de documentação Como ativar o acesso seguro ao banco de dados.
Criar a conexão do Looker com seu banco de dados
Na seção Administrador do Looker, selecione Conexões e clique em Adicionar conexão.
Preencher os detalhes de conexão. A maioria das configurações é comum à maioria dos dialetos de banco de dados. Consulte a página de documentação Como conectar o Looker ao banco de dados para mais informações. Algumas das configurações são descritas a seguir:
- Nome: o nome da conexão. É assim que a conexão vai ser mencionada no modelo do LookML.
- Dialeto: selecione Apache Spark 3+.
- Host: é o host do servidor do Thrift.
- Porta: a porta do servidor do Thrift (10000 por padrão).
- Banco de dados: o esquema/banco de dados padrão que será modelado. Quando nenhum banco de dados for especificado para uma tabela, isso será presumido.
- Nome de usuário: o usuário que fará a autenticação do Looker.
- Senha: a senha opcional do usuário do Looker.
- Ativar TDPs: use esse botão para ativar as tabelas derivadas persistentes. Quando as TDPs estão ativadas, a janela Conexão revela outras configurações de TDP e a seção Substituições de TDP.
- Banco de dados temporário: um esquema/banco de dados temporário para armazenar PDTs. Ele precisa ser criado com antecedência, com uma instrução como
CREATE SCHEMA looker_scratch;
. - Parâmetros adicionais do JDBC: adicione outros parâmetros JDBC do Hive aqui, como:
;spark.sql.inMemoryColumnarStorage.compressed=true
;auth=noSasl
- SSL: deixe essa opção desmarcada.
- Fuso horário do banco de dados: o fuso horário dos dados armazenados no Spark. Normalmente, esse campo pode ser deixado em branco ou definido como UTC.
- Fuso horário da consulta: é o fuso horário para mostrar os dados consultados no Looker.
Para verificar se a conexão foi bem-sucedida, clique em Testar. Consulte a página de documentação Como testar a conectividade do banco de dados para informações sobre solução de problemas.
Para salvar essas configurações, clique em Conectar.
Suporte a recursos
Para que o Looker ofereça suporte a alguns recursos, o dialeto do banco de dados também precisa ser compatível com eles.
Apache Spark 3 ou mais recente
O Apache Spark 3+ oferece suporte aos seguintes recursos a partir do Looker 24.14:
Recurso | Compatível? |
---|---|
Nível de suporte | Compatível |
Looker (Google Cloud Core) | Sim |
Agregações simétricas | Sim |
Tabelas derivadas | Sim |
Tabelas derivadas de SQL persistentes | Sim |
Tabelas derivadas nativas nativas | Sim |
Visualizações estáveis | Sim |
Eliminação de consultas | Sim |
Dinâmicas baseadas em SQL | Sim |
Fusos horários | Sim |
SSL | Sim |
Subtotais | Sim |
Parâmetros adicionais do JDBC | Sim |
Diferenciar maiúsculas e minúsculas | Sim |
Tipo de local | Sim |
Tipo de lista | Sim |
Percentil | Sim |
Percentil distinto | Não |
SQL Runner Show Processes | Não |
Tabela de descrição do executor do SQL | Sim |
Mostrar índices do SQL Runner | Não |
Seleção do SQL Runner 10 | Sim |
Contagem de executores do SQL | Sim |
Explicação do SQL | Sim |
Credenciais OAuth | Não |
Comentários de contexto | Sim |
Pool de conexão | Não |
Esboços do HLL | Não |
Agregar reconhecimento | Sim |
TDPs incrementais | Não |
Milissegundos | Sim |
Microssegundos | Sim |
Visualizações materializadas | Não |
Contagem aproximada diferente | Não |
Próximas etapas
Depois de criar a conexão, defina as opções de autenticação.