Tipos de bases de datos

Cuando creas un servicio de Dataproc Metastore, debes elegir si usar el tipo de base de datos de MySQL o el de Spanner.

Esta elección afecta las funciones que puedes integrar y usar con tu servicio de Dataproc Metastore. Es importante tener en cuenta que no puedes actualizar el tipo de base de datos después de crear un servicio de Dataproc Metastore. Asegúrate de elegir el tipo de base de datos adecuado para tus necesidades.

En esta página, se explican las diferencias entre estos tipos de bases de datos y cómo seleccionar una para tu servicio.

Diferencias entre MySQL y Spanner

MySQL

El tipo de base de datos MySQL de Dataproc Metastore es una implementación de Cloud SQL. Ten en cuenta lo siguiente cuando uses una base de datos de MySQL:

  • MySQL es el tipo de base de datos predeterminado cuando se crea un Dataproc Metastore.
  • Todas las versiones de Hive admiten MySQL.
  • MySQL admite todas las funciones de Dataproc Metastore.
  • MySQL admite la encriptación de Dataproc Metastore, como el uso de claves de encriptación administradas por el cliente (CMEK).

Spanner

El tipo de base de datos de Spanner de Dataproc Metastore es una implementación de Spanner. Ten en cuenta lo siguiente cuando uses una base de datos de Spanner:

  • Spanner solo es compatible con las versiones 2.3.6 y 3.1.2 de Hive.
  • Spanner solo admite importaciones de Avro.

Detalles adicionales

En la siguiente tabla, se proporcionan detalles adicionales sobre estas diferencias.

MySQL Spanner
Confiabilidad (tiempo de actividad) SLO de Cloud SQL del 99.95%* SLO de Spanner del 99.99%*
Períodos de mantenimiento Obligatorio No requeridos

Notas:

  • *Los SLO de Cloud SQL y Spanner no se traducen directamente a los SLO de Dataproc Metastore. Dataproc Metastore Tu selección de tipo de base de datos no afecta los SLOs de Dataproc Metastore.
  • No hay diferencia de precios entre los dos tipos de bases de datos.

Antes de comenzar

Funciones requeridas

Para obtener el permiso que necesitas para crear un metastore de Dataproc, pídele a tu administrador que te otorgue los siguientes roles de IAM en tu proyecto, según el principio de privilegio mínimo:

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

Este rol predefinido contiene el permiso metastore.services.create, que se requiere para crear un metastore de Dataproc.

También puedes obtener este permiso con roles personalizados o con otros roles predefinidos.

Para obtener más información sobre los roles y permisos específicos de Dataproc Metastore, consulta Administra el acceso de Dataproc con IAM.

Elige el tipo de base de datos

Eliges el tipo de base de datos cuando creas un servicio de Dataproc Metastore por primera vez.

En el siguiente ejemplo, se muestra una versión abreviada de los pasos que debes seguir para elegir un tipo de base de datos. Para obtener instrucciones completas paso a paso, consulta Cómo crear un servicio de Dataproc Metastore.

Console

  1. En la consola de Google Cloud, abre la página Dataproc Metastore:

    Abrir Dataproc Metastore

  2. En la barra de navegación, haz clic en Crear.

    Se abrirá la página Crear servicio.

  3. En Tipo de base de datos, selecciona MySQL o Spanner.

    MySQL es el tipo de base de datos predeterminado.

  4. Elige las configuraciones restantes para tu servicio según sea necesario.

  5. Haz clic en Enviar.

gcloud CLI

  1. Ejecuta el siguiente comando gcloud metastore services create:

    gcloud metastore services create SERVICE_ID \
       --location=LOCATION \
       --database-type=DATABASE_TYPE; default="mysql"
    

    Reemplaza lo siguiente:

    • SERVICE_ID: Es el nombre o el ID de tu servicio de Dataproc Metastore.
    • LOCATION: Es la región en la que reside tu servicio de Dataproc Metastore.
    • DATABASE_TYPE: Es el tipo de base de datos que deseas configurar para tu servicio de Dataproc Metastore. Los valores aceptados incluyen mysql y spanner. El valor predeterminado es mysql.

¿Qué sigue?