Apache Spark

Esta página contém informações sobre a associação do Looker ao Apache Spark 3.

O Looker estabelece ligação ao Apache Spark 3 ou superior através de uma ligação JDBC ao Spark Thrift Server.

Encriptar o tráfego de rede

É uma prática recomendada encriptar o tráfego de rede entre a aplicação Looker e a sua base de dados. Considere uma das opções descritas na página de documentação Ativar o acesso seguro à base de dados.

Criar a ligação do Looker à sua base de dados

Na secção Administração do Looker, selecione Ligações e, de seguida, clique em Adicionar ligação.

Preencha os detalhes da ligação. A maioria das definições é comum à maioria dos dialetos de bases de dados. Consulte a página de documentação Associar o Looker à sua base de dados para ver informações. Algumas das definições são descritas a seguir:

  • Nome: o nome da associação. É assim que a ligação vai ser referida no modelo LookML.
  • Dialeto: selecione Apache Spark 3 ou superior.
  • Anfitrião: o anfitrião do servidor Thrift.
  • Porta: a porta do servidor Thrift (10000 por predefinição).
  • Base de dados: o esquema/base de dados predefinido que vai ser modelado. Quando não é especificada nenhuma base de dados para uma tabela, esta é a base de dados assumida.
  • Nome de utilizador: o utilizador como o Looker se vai autenticar.
  • Palavra-passe: a palavra-passe opcional para o utilizador do Looker.
  • Ativar PDTs: use este botão para ativar as tabelas derivadas persistentes. Quando os PDTs estão ativados, a janela Ligação revela definições de PDTs adicionais e a secção Substituições de PDTs.
  • Base de dados temporária: um esquema/base de dados temporário para armazenar PDTs. Tem de ser criado previamente com uma declaração como CREATE SCHEMA looker_scratch;.
  • Parâmetros JDBC adicionais: adicione aqui quaisquer parâmetros JDBC do Hive adicionais, como:
    • ;spark.sql.inMemoryColumnarStorage.compressed=true
    • ;auth=noSasl
  • SSL: deixe esta opção desmarcada.
  • Fuso horário da base de dados: o fuso horário dos dados armazenados no Spark. Normalmente, pode deixá-lo em branco ou defini-lo como UTC.
  • Fuso horário da consulta: o fuso horário para apresentar os dados consultados no Looker.

Para verificar se a associação foi bem-sucedida, clique em Testar. Consulte a página de documentação Testar a conetividade da base de dados para ver informações de resolução de problemas.

Para guardar estas definições, clique em Associar.

Suporte de funcionalidades

Para que o Looker suporte algumas funcionalidades, o dialeto da base de dados também tem de as suportar.

Apache Spark 3 ou superior

O Apache Spark 3 ou superior suporta as seguintes funcionalidades a partir do Looker 25.14:

Funcionalidade Compatível?
Nível de apoio técnico
Suportado
Looker (Google Cloud Core)
Sim
Dados agregados simétricos
Sim
Tabelas derivadas
Sim
Tabelas derivadas SQL persistentes
Sim
Tabelas derivadas nativas persistentes
Sim
Vistas estáveis
Sim
Interrupção de consultas
Sim
Tabelas dinâmicas baseadas em SQL
Sim
Fusos horários
Sim
SSL
Sim
Subtotais
Sim
Parâmetros JDBC adicionais
Sim
Sensível a maiúsculas e minúsculas
Sim
Tipo de localização
Sim
Tipo de lista
Sim
Percentil
Sim
Percentil distinto
Não
Execução de SQL Mostrar processos
Não
Execução de SQL Describe Table
Sim
Execução de SQL Mostrar índices
Não
Execução de SQL Select 10
Sim
Contagem da execução de SQL
Sim
SQL Explain
Sim
Credenciais do OAuth 2.0
Não
Comentários de contexto
Sim
Agrupamento de ligações
Não
Esboços HLL
Não
Notoriedade agregada
Sim
PDTs incrementais
Não
Milissegundos
Sim
Microssegundos
Sim
Vistas materializadas
Não
Medidas de comparação de períodos
Não
Contagem distinta aproximada
Não

Passos seguintes

Depois de criar a associação, defina as opções de autenticação.