Apache Hive

Esta página contém informações sobre como conectar o Looker ao Apache Hive 2.3+ e ao Apache Hive 3.1.2+.

Observe o seguinte sobre o suporte do Looker para as diferentes versões do Apache Hive:

O Looker é compatível com conexões ao Apache Hive 2.3 e versões mais recentes e ao Apache Hive 3.1.2 e versões mais recentes.
Para o Apache Hive 3.1.2 e versões mais recentes, o Looker só pode se integrar totalmente aos bancos de dados do Apache Hive 3 em versões posteriores a 3.1.2. Isso ocorre devido a um problema de análise de consultas nas versões 2.4.0 a 3.1.2 do Hive, que resultou em tempos de análise extremamente longos para o SQL gerado pelo Looker.
O Looker não é compatível com conexões ao Apache Hive 2. As consultas em conexões com o Apache Hive 2 vão retornar um erro.

Criptografar o tráfego de rede

É uma prática recomendada criptografar o tráfego de rede entre o aplicativo Looker e seu banco de dados. Considere uma das opções descritas na página de documentação Como ativar o acesso seguro ao banco de dados.

Introdução

O Looker foi projetado para se conectar a um servidor de banco de dados usando JDBC. No caso do Hive, esse é o servidor thrift (HiveServer2). Consulte a documentação do Apache para mais informações.

Por padrão, esse servidor detecta a porta 10000.

O Looker é uma ferramenta de consulta interativa, então ele espera trabalhar com um mecanismo SQL interativo. Se o Hive estiver sendo executado no MapReduce (hive.execution.engine definido como mr), ele vai retornar os resultados da consulta muito lentamente para ser prático.

O Looker foi testado com o Hive no Tez (hive.execution.engine=tez), mas também é possível executar o Looker com o Hive no Spark. O suporte ao Spark foi adicionado na versão 1.1 do Hive. O Looker é compatível com o Hive 1.2.1 e versões mais recentes.

Tabelas derivadas persistentes (PDTs)

Para ativar as tabelas derivadas persistentes (TDPs) no Looker usando uma conexão do Hive, crie um esquema temporário para o Looker usar. Confira a seguir um exemplo de comando que pode ser usado para criar um esquema looker_scratch:

 CREATE SCHEMA looker_scratch;

A conta de usuário que o Looker usa para se conectar ao Hive (que pode ser anônima se nenhuma autenticação for usada) precisa ter as seguintes capacidades no esquema temporário:

crie tabelas
Alterar tabelas
Remover tabelas

Teste com um cliente JDBC antes de tentar criar PDTs com o Hive.

Filas

Se você quiser que as consultas do Looker entrem em uma fila específica, insira o parâmetro de nome da fila no campo Parâmetros JDBC adicionais na página Configurações de conexão:

?tez.queue.name=the_bi_queue

Outros parâmetros do Hive podem ser definidos dessa forma no campo Parâmetros JDBC adicionais na página Configurações de conexão.

Com os atributos do usuário, é possível que consultas de usuários ou grupos diferentes sejam colocadas em filas diferentes. Para fazer isso, crie um atributo de usuário com um nome como queue_name e, no campo Outros parâmetros JDBC, adicione o seguinte:

?tez.queue.name={{ _user_attributes['queue_name'] }}

Você também pode usar isso para personalizar outros parâmetros hive-site.xml por usuário ou grupo.

Criar a conexão do Looker com seu banco de dados

Siga estas etapas para criar a conexão do Looker com seu banco de dados:

Na seção Administrador do Looker, selecione Conexões e clique em Adicionar conexão.
Selecione Apache Hive 2.3+ ou Apache Hive 3.1.2+ no menu suspenso Dialeto.

Observação: se você estiver em uma instância do Looker (Google Cloud Core) e não encontrar seu dialeto no menu suspenso Dialeto, consulte a documentação do Looker (Google Cloud Core) para verificar se o dialeto é compatível com instâncias do Looker (Google Cloud Core).
Preencher os detalhes de conexão. A maioria das configurações é comum para a maioria dos dialetos de banco de dados. Consulte a página de documentação Conectar o Looker ao seu banco de dados para mais informações. Algumas das configurações são descritas a seguir:
- Nome: especifique o nome da conexão. É assim que você vai se referir à conexão nos projetos do LookML.
- Host: especifique o nome do host.
- Porta: especifique a porta do banco de dados.
- Banco de dados: especifique o nome do banco de dados.
- Nome de usuário: especifique o nome de usuário do banco de dados.
- Senha: especifique a senha do usuário do banco de dados.
- Ativar TDPs: use essa opção para ativar as tabelas derivadas persistentes. Quando as TDPs estão ativadas, a janela Conexão mostra outras configurações de TDP e a seção Substituições de TDP.
- Banco de dados temporário: especifique o nome do esquema temporário criado na seção Tabelas derivadas permanentes (PDTs) desta página de documentação.
- Número máximo de conexões do builder da TDP: especifique o número de builds simultâneos possíveis de TDP nessa conexão. Definir esse valor muito alto pode afetar negativamente os tempos de consulta. Para mais informações, consulte a página de documentação Conectar o Looker ao seu banco de dados.
- Parâmetros JDBC adicionais: especifique outros parâmetros de string JDBC.
- Programação de manutenção: especifique uma expressão cron que indica quando o Looker deve verificar grupos de dados e tabelas derivadas persistentes. Leia mais sobre essa configuração na documentação Programação de manutenção.
- SSL: marque para usar conexões SSL.
- Verificar SSL: verifique se há verificação de nome de host.
- Máximo de conexões por nó: essa configuração pode ser deixada com o valor padrão inicialmente. Consulte a página de documentação Como conectar o Looker ao seu banco de dados para mais informações.
- Tempo limite do pool de conexões: essa configuração pode ser deixada com o valor padrão inicialmente. Leia mais sobre essa configuração na seção Tempo limite do pool de conexões da página de documentação Como conectar o Looker ao seu banco de dados.
- Pré-cache do SQL Runner: para que o SQL Runner não pré-carregue informações de tabela e carregue apenas quando uma tabela for selecionada, desmarque essa opção. Leia mais sobre essa configuração na seção Pré-cache do SQL Runner da página de documentação Conectar o Looker ao seu banco de dados.
- Fuso horário do banco de dados: especifique o fuso horário usado no banco de dados. Deixe esse campo em branco se não quiser a conversão de fuso horário. Consulte a página de documentação Como usar as configurações de fuso horário para mais informações.
Para verificar se a conexão foi bem-sucedida, clique em Testar. Consulte a página de documentação Testar a conectividade do banco de dados para informações sobre solução de problemas.
Para salvar essas configurações, clique em Conectar.

Suporte a recursos

Para que o Looker ofereça suporte a alguns recursos, o dialeto do banco de dados também precisa ser compatível com eles.

Apache Hive 2.3 ou mais recente

O Apache Hive 2.3+ é compatível com os seguintes recursos a partir do Looker 25.16:

Recurso	Compatível?
Nível de suporte	Integração
Looker (Google Cloud Core)	Não
Agregações simétricas	Não
Tabelas derivadas	Sim
Tabelas derivadas persistentes do SQL	Sim
Tabelas derivadas nativas persistentes	Sim
Visualizações estáveis	Sim
Interrupção de consultas	Sim
Tabelas dinâmicas baseadas em SQL	Não
Fusos horários	Sim
SSL	Sim
Subtotais	Sim
Parâmetros adicionais do JDBC	Sim
Diferenciação entre maiúsculas e minúsculas	Sim
Tipo de local	Sim
Tipo de lista	Sim
Percentil	Sim
Percentil distinto	Não
Mostrar processos do SQL Runner	Não
Descrever tabela do SQL Runner	Sim
Mostrar índices do SQL Runner	Sim
Selecionar 10 no SQL Runner	Sim
Contagem do SQL Runner	Sim
Explicação do SQL	Sim
Credenciais do OAuth 2.0	Não
Comentários de contexto	Sim
Pooling de conexão	Não
Esboços HLL	Não
Reconhecimento agregado	Sim
TDPs incrementais	Não
Milissegundos	Sim
Microssegundos	Sim
Visualizações materializadas.	Não
Medidas de comparação de períodos	Não
Contagem aproximada aproximada	Não

Apache Hive 3.1.2 ou mais recente

O Apache Hive 3.1.2+ é compatível com os seguintes recursos a partir do Looker 25.16:

Recurso	Compatível?
Nível de suporte	Com suporte
Looker (Google Cloud Core)	Sim
Agregações simétricas	Não
Tabelas derivadas	Sim
Tabelas derivadas persistentes do SQL	Sim
Tabelas derivadas nativas persistentes	Sim
Visualizações estáveis	Sim
Interrupção de consultas	Sim
Tabelas dinâmicas baseadas em SQL	Não
Fusos horários	Sim
SSL	Sim
Subtotais	Sim
Parâmetros adicionais do JDBC	Sim
Diferenciação entre maiúsculas e minúsculas	Sim
Tipo de local	Sim
Tipo de lista	Sim
Percentil	Sim
Percentil distinto	Não
Mostrar processos do SQL Runner	Não
Descrever tabela do SQL Runner	Sim
Mostrar índices do SQL Runner	Não
Selecionar 10 no SQL Runner	Sim
Contagem do SQL Runner	Sim
Explicação do SQL	Sim
Credenciais do OAuth 2.0	Não
Comentários de contexto	Sim
Pooling de conexão	Não
Esboços HLL	Não
Reconhecimento agregado	Sim
TDPs incrementais	Não
Milissegundos	Sim
Microssegundos	Sim
Visualizações materializadas.	Não
Medidas de comparação de períodos	Não
Contagem aproximada aproximada	Não

Próximas etapas

Depois de conectar seu banco de dados ao Looker, configure as opções de login para seus usuários.