En esta página, se muestra un ejemplo del uso de Apache Hive con un servicio de Dataproc Metastore. En este ejemplo, inicias una sesión de Hive en un clúster de Dataproc y, luego, ejecutas comandos de muestra para crear una base de datos y una tabla.
Antes de comenzar
- Crea un servicio de Dataproc Metastore.
- Conecta el servicio de Dataproc Metastore a un clúster de Dataproc.
Conéctate a Apache Hive
Para comenzar a usar Hive, usa SSH para conectarte al clúster de Dataproc que está asociado con tu servicio de Dataproc Metastore. Una vez que te conectes, podrás ejecutar comandos de Hive desde la ventana de la terminal SSH en tu navegador para administrar tus metadatos.
Cómo conectarse a Hive
- En la consola de Google Cloud, ve a la página Instancias de VM.
- En la lista de instancias de máquina virtual, haz clic en SSH en la fila de la instancia de VM de Dataproc a la que deseas conectarte.
Se abrirá una ventana del navegador en tu directorio principal del nodo con un resultado similar al siguiente:
Connected, host fingerprint: ssh-rsa ...
Linux cluster-1-m 3.16.0-0.bpo.4-amd64 ...
...
example-cluster@cluster-1-m:~$
Para iniciar Hive y crear una base de datos y una tabla, ejecuta los siguientes comandos en la sesión de SSH:
Inicia Hive.
hive
Crea una base de datos con el nombre
myDatabase
.create database myDatabase;
Muestra la base de datos que creaste.
show databases;
Usa la base de datos que creaste.
use myDatabase;
Crea una tabla con el nombre
myTable
.create table myTable(id int,name string);
Haz una lista de las tablas en
myDatabase
.show tables;
Muestra las filas de la tabla que creaste.
desc MyTable;
Si ejecutas los siguientes comandos, se generará un resultado similar al siguiente:
$hive
hive> show databases;
OK
default
hive> create database myDatabase;
OK
hive> use myDatabase;
OK
hive> create table myTable(id int,name string);
OK
hive> show tables;
OK
myTable
hive> desc myTable;
OK
id int
name string