Nesta página, mostramos um exemplo de como usar o Apache Hive com um serviço do metastore do Dataproc. Neste exemplo, você inicia uma sessão do Hive em um cluster do Dataproc e executa comandos de amostra para criar um banco de dados e uma tabela.
Antes de começar
- Crie um serviço Metastore do Dataproc.
- Anexe o serviço Metastore do Dataproc a um cluster do Dataproc.
Conectar-se ao Apache Hive
Para começar a usar o Hive, use SSH para se conectar ao cluster do Dataproc associado ao serviço metastore do Dataproc. Depois de se conectar, você pode executar comandos do Hive na janela do terminal SSH no navegador para gerenciar seus metadados.
Para se conectar ao Hive
- No console do Google Cloud , acesse a página Instâncias de VM.
- Na lista de instâncias de máquina virtual, clique em SSH na linha da instância de VM do Dataproc a que você quer se conectar.
Uma janela de navegador é aberta no diretório inicial do nó com uma saída semelhante a esta:
Connected, host fingerprint: ssh-rsa ...
Linux cluster-1-m 3.16.0-0.bpo.4-amd64 ...
...
example-cluster@cluster-1-m:~$
Para iniciar o Hive e criar um banco de dados e uma tabela, execute os seguintes comandos na sessão SSH:
Inicie o Hive.
hive
Crie um banco de dados chamado
myDatabase
.create database myDatabase;
Mostre o banco de dados que você criou.
show databases;
Use o banco de dados que você criou.
use myDatabase;
Crie uma tabela denominada
myTable
.create table myTable(id int,name string);
Liste as tabelas em
myDatabase
.show tables;
Mostre as linhas na tabela que você criou.
desc MyTable;
A execução dos comandos a seguir gera uma saída semelhante a esta:
$hive
hive> show databases;
OK
default
hive> create database myDatabase;
OK
hive> use myDatabase;
OK
hive> create table myTable(id int,name string);
OK
hive> show tables;
OK
myTable
hive> desc myTable;
OK
id int
name string