En esta página, se explica cómo actualizar un servicio de Dataproc Metastore.
Puedes actualizar tu servicio de Dataproc Metastore para cambiar la configuración o habilitar o inhabilitar funciones opcionales.
Antes de comenzar
Roles obligatorios
Para obtener el permiso que necesitas para actualizar un servicio de Dataproc Metastore, pídele a tu administrador que te otorgue los siguientes roles de IAM en tu proyecto, según el principio de privilegio mínimo:
-
Cómo otorgar control total de los recursos de Dataproc Metastore (
roles/metastore.editor
) -
Otorga acceso completo a todos los recursos de Dataproc Metastore, incluida la administración de políticas de IAM (
roles/metastore.admin
)
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
Este rol predefinido contiene el permiso metastore.services.update
, que se requiere para actualizar un servicio de Dataproc Metastore.
También puedes obtener este permiso con roles personalizados o con otros roles predefinidos.
Para obtener más información sobre los roles y permisos específicos de Dataproc Metastore, consulta la Descripción general de IAM de Dataproc Metastore.Acerca de la actualización de un servicio
Puedes actualizar los siguientes parámetros de Dataproc Metastore.
- Número de puerto Actualiza el número de puerto TCP de la interfaz de Apache Thrift.
- Nivel de servicio. Cambiar entre el nivel de servicio Developer o Enterprise Estos niveles influyen en la capacidad del servicio.
- Sincronización de Data Catalog Activa o desactiva la función de sincronización de Data Catalog.
- Período de mantenimiento. Cambia la frecuencia del período de mantenimiento, incluidos el Día de la semana y la Hora del día.
- Kerberos. Habilita o inhabilita la autenticación de Kerberos. Si ya la habilitaste, puedes actualizar tus archivos de configuración de Kerberos.
- Configuraciones del almacén de metadatos de Hive Actualiza la ubicación del directorio de tu almacén de Hive.
- Configuración de la versión auxiliar (vista previa). Habilitar, inhabilitar o agregar versiones auxiliares adicionales
- Etiquetas. Agrega o quita etiquetas opcionales que describan tus metadatos.
- Factor de escala. Cambia el factor de escala. Puedes habilitar o inhabilitar el ajuste de escala automático y actualizar los factores de ajuste de escala mínimo o máximo.
Actualizar un servicio
Antes de ejecutar una actualización, ten en cuenta las siguientes consideraciones:
- Solo puedes ejecutar un trabajo de actualización a la vez (para cada servicio de Dataproc Metastore).
- Puedes actualizar varios parámetros en un solo trabajo de actualización.
- Puedes seguir usando Dataproc Metastore mientras se actualiza.
Cuando la actualización se realiza con éxito, Dataproc Metastore ingresa automáticamente al estado activo. Si la actualización falla, el servicio de Dataproc Metastore se revierte a su estado correcto anterior.
En las siguientes instrucciones, se muestra cómo actualizar un servicio de Dataproc Metastore.
Console
En la Google Cloud consola, abre la página Dataproc Metastore:
En la página Dataproc Metastore, haz clic en el nombre del servicio que quieres actualizar.
Se abrirá la página Detalles del servicio.
La página de detalles del servicio de Dataproc Metastore En la pestaña Configuración, haz clic en Editar.
Se abrirá la página Editar servicio.
Elige los valores que deseas actualizar para tu servicio.
Haz clic en Enviar.
Regresa a la página Dataproc Metastore y verifica que tu servicio se haya actualizado correctamente.
gcloud CLI
Para actualizar un servicio, ejecuta el siguiente comando
gcloud metastore services update
:gcloud metastore services update SERVICE \ --location=LOCATION \ --port=PORT \ --tier=TIER \ --maintenance-window-day=MAINTENANCE_WINDOW_DAY \ --maintenance-window-hour=MAINTENANCE_WINDOW_HOUR \ --kerberos_principal=KERBEROS_PRINCIPAL \ --keytab=KEYTAB \ --krb5-config=KRB5_CONFIG \ --update-hive-metastore-configs-from-file=[KEY=VALUE, ...] \ --clear-hive-metastore-configs \ --remove-hive-metastore-configs=[KEY, ...] \ --update-labels=[KEY=VALUE, ...] \ --clear-labels \ --remove-labels=[KEY, ...]
Reemplaza lo siguiente:
SERVICE
: Es el nombre de tu servicio de Dataproc Metastore.LOCATION
: Es la región de Google Cloud en la que reside tu servicio de Dataproc Metastore.PORT
: Opcional: Es el puerto TCP de la interfaz de Thrift que usas con tu servicio de Dataproc Metastore.TIER
: Opcional: Es la capacidad de nivel de tu servicio de Dataproc Metastore.MAINTENANCE_WINDOW_DAY
: Opcional: Día de la semana en que se inicia el período de servicio.MAINTENANCE_WINDOW_HOUR
: Opcional: Hora del día en que se inicia el período de servicio.KERBEROS_PRINCIPAL
: (Opcional) Un principal de Kerberos que existe en el archivo keytab y en el KDC. Un principal típico tiene la forma “principal/instancia@DOMINIO”, pero no hay un formato exacto.KEYTAB
: (Opcional) Un archivo keytab de Kerberos que se usa para autenticar un principal de servicio con un centro de distribución de claves de Kerberos.KRB5_CONFIG
: (Opcional) El archivo krb5.config especifica el KDC y la información del dominio de Kerberos, que incluye ubicaciones del KDC y configuraciones predeterminadas para las aplicaciones de Kerberos y el dominio.[KEY, ...]
: Opcional: Es la configuración del almacén de metadatos de Hive que deseas actualizar. Si existe una variable en este campo, se actualiza su valor. De lo contrario, se creará una variable nueva. Si se establece esta marca,-clear-hive-metastore-configs
también se establece automáticamente.[KEY, ...]
: Opcional: Es la configuración de Hive metastore que deseas quitar.[KEY=VALUE, ...]
: Opcional: Las etiquetas o las configuraciones de par clave-valor del almacén de metadatos de Hive que deseas actualizar.[KEY, ...]
: Opcional: Las etiquetas o las configuraciones de par clave-valor del almacén de metadatos de Hive que deseas quitar.
Verifica que la actualización se haya realizado correctamente.
REST
Sigue las instrucciones de la API para actualizar un servicio mediante el Explorador de API.
Actualiza la configuración del almacén de datos de Hive Metastore
Si tu directorio de almacén de Hive está en Cloud Storage, debes establecer una anulación de configuración de Metastore. Esta anulación establece tu almacén de datos específico como el directorio de almacén predeterminado para Dataproc Metastore.
Antes de configurar este reemplazo, asegúrate de que tu servicio de Dataproc Metastore tenga permisos de lectura y escritura de objetos para acceder al directorio de almacenes. Para obtener más información, consulta Directorio de almacén de Hive.
En las siguientes instrucciones, se muestra cómo actualizar una anulación de configuración de Hive Metastore.
Console
En la Google Cloud consola, abre la página Dataproc Metastore:
En la página Dataproc Metastore, haz clic en el nombre del servicio que quieres actualizar.
Se abrirá la página Detalles del servicio.
En la pestaña Configuración, haz clic en Editar.
Se abrirá la página Editar servicio.
En Anulaciones de configuración de Metastore, ingresa lo siguiente:
- Clave: Ingresa el siguiente valor:
hive.metastore.warehouse.dir
. - Valor: Es la ubicación de Cloud Storage de tu directorio de almacén. Por ejemplo:
gs://my-bucket/path/to/location
.
- Clave: Ingresa el siguiente valor:
Haz clic en Enviar.
Regresa a la página Dataproc Metastore y verifica que tu servicio se haya actualizado correctamente.
gcloud
Para actualizar un servicio, ejecuta el siguiente comando
gcloud metastore services update
:gcloud metastore services update SERVICE \ --location=LOCATION \ --update-hive-metastore-configs="hive.metastore.warehouse.dir=CUSTOMER_DIR"
Reemplaza lo siguiente:
SERVICE
: Es el nombre de tu servicio de Dataproc Metastore.LOCATION
: Es la región de Google Cloud en la que reside tu servicio de Dataproc Metastore.CUSTOMER_DIR
: Es la ubicación de Cloud Storage del directorio de tu almacén. Por ejemplo:gs://my-bucket/path/to/location
.
Verifica que la actualización se haya realizado correctamente.