En esta página se muestra un ejemplo de cómo usar Apache Hive con un servicio Dataproc Metastore. En este ejemplo, se inicia una sesión de Hive en un clúster de Dataproc y, a continuación, se ejecutan comandos de ejemplo para crear una base de datos y una tabla.
Antes de empezar
- Crea un servicio de Dataproc Metastore.
- Vincula el servicio Dataproc Metastore a un clúster de Dataproc.
Conectarse a Apache Hive
Para empezar a usar Hive, usa SSH para conectarte al clúster de Dataproc asociado a tu servicio Dataproc Metastore. Una vez que se haya conectado, podrá ejecutar comandos de Hive desde la ventana del terminal SSH de su navegador para gestionar los metadatos.
Para conectarte a Hive
- En la consola de Google Cloud , ve a la página Instancias de VM.
- En la lista de instancias de máquina virtual, haz clic en SSH en la fila de la instancia de máquina virtual de Dataproc a la que quieras conectarte.
Se abrirá una ventana del navegador en el directorio principal del nodo con un resultado similar al siguiente:
Connected, host fingerprint: ssh-rsa ...
Linux cluster-1-m 3.16.0-0.bpo.4-amd64 ...
...
example-cluster@cluster-1-m:~$
Para iniciar Hive y crear una base de datos y una tabla, ejecuta los siguientes comandos en la sesión SSH:
Inicia Hive.
hive
Crea una base de datos llamada
myDatabase
.create database myDatabase;
Muestra la base de datos que has creado.
show databases;
Usa la base de datos que has creado.
use myDatabase;
Crea una tabla llamada
myTable
.create table myTable(id int,name string);
Enumera las tablas de
myDatabase
.show tables;
Muestra las filas de la tabla que has creado.
desc MyTable;
Al ejecutar los siguientes comandos, se genera un resultado similar al siguiente:
$hive
hive> show databases;
OK
default
hive> create database myDatabase;
OK
hive> use myDatabase;
OK
hive> create table myTable(id int,name string);
OK
hive> show tables;
OK
myTable
hive> desc myTable;
OK
id int
name string