Si usas Data Catalog, puedes migrar el contenido y el uso de Data Catalog al catálogo universal de BigQuery siguiendo los pasos que se describen en este documento.
Si es la primera vez que usas el catálogo, comienza con el catálogo universal. Para ello, configúralo como tu experiencia de catálogo predeterminada.
Este documento está dirigido a administradores y custodios de datos.
El catálogo universal tiene una nueva API y una interfaz web. La transición al catálogo universal permite que tus cargas de trabajo y usuarios existentes y futuros se beneficien de sus funciones y capacidades mejoradas. Para obtener más información, consulta Descripción general del catálogo universal.
Para comparar el catálogo universal y Data Catalog, consulta Catálogo universal en comparación con Data Catalog.
Antes de comenzar la transición, revisa las funciones que no son compatibles con el catálogo universal.
Descripción general de la transición
La página Administra la transición a Dataplex en la consola de Google Cloud proporciona un único punto de acceso para administrar la transición.
En esta sección, se describen los diversos casos de transición y se describe el proceso de transición para cada uno de ellos.
Si no tienes metadatos personalizados en Data Catalog o si nunca lo usaste
Si usas Data Catalog y no tienes metadatos personalizados, como etiquetas, plantillas de etiquetas, entradas personalizadas o grupos de entradas, o si nunca usaste Data Catalog, completa la transición configurando tu experiencia de IU de catalog predeterminada en el catálogo universal.
Si tienes metadatos personalizados de Data Catalog o cargas de trabajo programáticas
Si usas Data Catalog con metadatos personalizados (como etiquetas,
plantillas de etiquetas, entradas personalizadas o grupos de entradas), Dataplex puede importar
automáticamente estos metadatos personalizados al catálogo universal
como read-only
. Para habilitar esta función, se requieren cambios de configuración como se describe en la fase preparatoria.
La segunda fase es la fase de transferencia, en la que el estado activo (read-write
) de tus metadatos personalizados se traslada al catálogo universal. Durante
esta fase, también debes actualizar las cargas de trabajo programáticas (como la API,
bibliotecas cliente, módulos de Terraform y comandos de Google Cloud CLI) para interactuar
con el catálogo universal.
A continuación, se proporcionan más detalles sobre cada fase del proceso de transición:
Fase preparatoria: Realiza las tareas de configuración necesarias para que el contenido de Data Catalog esté disponible de forma simultánea en el catálogo universal como
read-only
. Durante esta fase, Data Catalog sigue siendo la fuente autorizada para tu contenido de metadatos.La fase preparatoria incluye las siguientes tareas:
- Actualiza las plantillas de etiquetas privadas de Data Catalog a públicas.
- Habilita las etiquetas y plantillas de etiquetas para que los metadatos estén disponibles de forma simultánea en el catálogo universal.
- Configura los permisos de IAM de Dataplex para tus metadatos personalizados.
Para obtener más información, consulta Fase preparatoria.
Fase de transferencia: Mueve el uso del catálogo y el estado activo (
read-write
) de tus metadatos personalizados al catálogo universal.La fase de transferencia incluye las siguientes tareas:
- Establece la experiencia de IU de catálogo predeterminada en el catálogo universal.
Transfiere los metadatos personalizados de Data Catalog al catálogo universal.
Debes esperar al menos 48 horas después de habilitar las plantillas de etiquetas y las etiquetas para poder transferir los metadatos personalizados. Este tiempo es necesario para el procesamiento interno.
Actualiza las cargas de trabajo programáticas.
Cuando completes la fase de transferencia, el catálogo universal se convertirá en la fuente autorizada para todos tus metadatos, y no necesitarás usar Data Catalog.
Para obtener más información, consulta Fase de transferencia.
Roles obligatorios
Para obtener los permisos que necesitas para realizar la transición de Data Catalog al catálogo universal, otorga los siguientes roles de IAM en el recurso:
Actualiza las plantillas de etiquetas privadas a públicas: Propietario de TagTemplate de Data Catalog (
roles/datacatalog.tagTemplateOwner
)Este rol predefinido contiene el permiso
datacatalog.tagTemplates.update
, que se requiere para actualizar las plantillas de etiquetas privadas a públicas.Habilita las plantillas de etiquetas y etiquetas públicas para la disponibilidad simultánea de metadatos en el catálogo universal: Administrador de la configuración de migración de DataCatalog (
roles/datacatalog.migrationConfigAdmin
).Este rol predefinido contiene el permiso
datacatalog.migrationConfig.set
, que es necesario para habilitar las plantillas y las etiquetas.Configurar la experiencia de IU de Catalog predeterminada en el catálogo universal: Administrador de la configuración de migración de DataCatalog (
roles/datacatalog.migrationConfigAdmin
)Este rol predefinido contiene el permiso
datacatalog.migrationConfig.set
, que se requiere para configurar la experiencia predeterminada de la IU del catálogo.Transferir plantillas de etiquetas públicas de Data Catalog al catálogo universal: Propietario de TagTemplate de Data Catalog (
roles/datacatalog.tagTemplateOwner
)Este rol predefinido contiene el permiso
datacatalog.tagTemplates.update
, que se requiere para transferir plantillas de etiquetas públicas.Transferir grupos de entradas de Data Catalog al catálogo universal: Propietario de EntryGroup de DataCatalog (
roles/datacatalog.entryGroupOwner
)Este rol predefinido contiene el permiso
datacatalog.entryGroups.update
, que se requiere para transferir grupos de entradas.
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
También puedes obtener los permisos necesarios con roles personalizados o cualquier otro rol predefinido.
Fase preparatoria
Esta fase incluye tareas para que el contenido de metadatos de Data Catalog esté disponible de forma simultánea en el catálogo universal, en el modo read-only
.
Los siguientes son los puntos clave que debes recordar durante la fase preparatoria:
- Data Catalog sigue siendo la fuente autorizada para tus metadatos personalizados.
- La página Búsqueda de Dataplex dirige a la búsqueda de Data Catalog de forma predeterminada, que solo incluye metadatos de Data Catalog y no metadatos de catálogo universal.
- Es posible que la búsqueda del catálogo universal no incluya todas las plantillas de etiquetas públicas ni las etiquetas de Data Catalog hasta que completes la fase preparatoria.
Más información sobre la disponibilidad simultánea de los metadatos de Data Catalog en el catálogo universal
Los grupos de entradas personalizadas de Data Catalog y sus entradas ya están disponibles de forma simultánea en el catálogo universal como read-only
. Cuando
habilitas las etiquetas y plantillas de etiquetas públicas
en la fase preparatoria, su contenido estará disponible de forma simultánea en
el catálogo universal como read-only
.
En la siguiente tabla, se muestra la asignación entre los recursos de Data Catalog y los del catálogo universal cuando los recursos de Data Catalog están disponibles de forma simultánea en el catálogo universal:
Recurso de Data Catalog | Recurso del catálogo universal correspondiente | Descripción |
---|---|---|
Plantilla de etiqueta | Tipo de aspecto (global) | Las plantillas de etiquetas de Data Catalog son recursos regionales. Cuando habilitas las plantillas de etiquetas, su contenido está disponible de forma simultánea como tipos de aspecto globales en el catálogo universal. Esto se hace para preservar las referencias entre regiones entre las etiquetas y las plantillas de etiquetas. Las definiciones de los tipos de aspecto globales se replican en todas las regiones de Google Cloud . Los conceptos estándar, como |
Etiqueta | Aspecto opcional | Cuando habilitas las plantillas de etiquetas, sus etiquetas están disponibles de forma simultánea como aspectos opcionales en el catálogo universal. Para obtener más información, consulta Categorías de aspectos. |
Grupo de entradas | Grupo de entradas | Los grupos de entradas para las entradas del sistema se establecen por proyecto y por región en el catálogo universal. Los grupos de entradas creados en Data Catalog están disponibles de forma simultánea en el catálogo universal. |
Entrada personalizada | Entrada personalizada | Todas las entradas personalizadas de Data Catalog están disponibles de forma simultánea
como entradas de GenericEntryType en el
catálogo universal.
Para obtener más información, consulta Categorías de tipos de entradas.
|
Entrada del sistema (Google Cloud) | Aspecto obligatorio de entrada del sistema | Los metadatos que describen las entradas del sistema, como Schema para las tablas de BigQuery, se capturan en los aspectos obligatorios de los tipos de aspectos definidos por el sistema.
|
Actualiza las plantillas de etiquetas privadas de Data Catalog a públicas
El catálogo universal no admite el concepto de aspectos privados (equivalentes a las etiquetas privadas). Por lo tanto, las etiquetas y plantillas de etiquetas privadas no están disponibles de forma simultánea en el catálogo universal. Para propagarlas en el catálogo universal, debes actualizarlas a públicas.
Antes de continuar, revisa la estructura de las plantillas de etiquetas privadas para asegurarte de que su estructura y metadatos sean coherentes con la visibilidad de las etiquetas públicas.
Para actualizar las plantillas de etiquetas privadas y las etiquetas a públicas, sigue estos pasos:
Console
En la consola de Google Cloud, ve a la página Catálogo de Dataplex.
Haz clic en Administrar la transición a Dataplex.
Haz clic en la pestaña Plantillas de etiquetas privadas.
Haz clic en Administrar plantillas de etiquetas.
En la página Plantillas de etiquetas, haz clic en la plantilla de etiqueta privada que deseas actualizar.
En la página Detalles de la plantilla, haz clic en Editar.
En la sección Visibilidad, selecciona Público.
Haz clic en Actualizar.
REST
Para actualizar las plantillas de etiquetas privadas a públicas, usa el método tagTemplates.patch
.
Habilita las etiquetas y plantillas de etiquetas públicas para que los metadatos estén disponibles de forma simultánea en el catálogo universal
Cuando proporciones la habilitación, el contenido de las etiquetas y plantillas de etiquetas públicas de Data Catalog se propaga de forma automática y continua al catálogo universal en tu Google Cloud organización o proyecto (sin una organización). Las etiquetas y plantillas de etiquetas públicas de Data Catalog se propagan al catálogo universal como tipos de aspectos y aspectos públicos, respectivamente. Las definiciones de los tipos de aspecto globales se replican en todas las regiones de Google Cloud .
Para habilitar las etiquetas y plantillas de etiquetas públicas, sigue estos pasos:
Console
En la consola de Google Cloud, ve a la página Catálogo de Dataplex.
Haz clic en Administrar la transición a Dataplex.
Haz clic en la pestaña Habilitar.
Haz clic en Proporcionar la habilitación.
En el cuadro de diálogo de confirmación, ingresa el texto que se muestra y haz clic en Confirmar.
REST
Para habilitar las plantillas de etiquetas y las etiquetas, usa el método setConfig
.
Para las Google Cloud organizaciones y los proyectos sin una organización, puedes revocar la habilitación proporcionada originalmente. Para ello, haz clic en Renunciar a la habilitación. Cuando revocas la habilitación, se detiene el proceso de propagación de las etiquetas y plantillas de etiquetas de Data Catalog al catálogo universal. Se borrarán los tipos de aspecto y aspectos del catálogo universal que se creen con el proceso de habilitación, pero que no se transfieran al catálogo universal. El proceso de eliminación puede tardar hasta 12 horas.
Configura los permisos de IAM de Dataplex para tus metadatos personalizados
Los tipos de aspecto del catálogo universal y los grupos de entradas personalizados que representan plantillas de etiquetas y grupos de entradas de Data Catalog no heredan los permisos de IAM originales de Data Catalog. Debes configurar manualmente los permisos de IAM de Dataplex para esos tipos de aspectos y grupos de entradas personalizados.
Por ejemplo, si deseas crear aspectos con un tipo de aspecto propagado (que representa una plantilla de etiqueta de Data Catalog), debes configurar los permisos de IAM necesarios para ese tipo de aspecto. Del mismo modo, cuando transfieres metadatos personalizados, para crear entradas personalizadas dentro de un grupo de entradas personalizado propagado, debes configurar los permisos de IAM necesarios para ese grupo de entradas.
Para obtener más información sobre cómo los permisos de IAM en Data Catalog corresponden a los del catálogo universal, consulta Asignación de permisos de IAM entre Data Catalog y el catálogo universal.
Para configurar los permisos de IAM de Dataplex necesarios para los tipos de aspectos y los grupos de entradas personalizados, sigue estos pasos:
Console
En la consola de Google Cloud, ve a la página Catálogo de Dataplex.
Haz clic en Administrar la transición a Dataplex.
Haz clic en la pestaña Permisos de IAM de Dataplex.
Para configurar los permisos de IAM de Dataplex para los tipos de aspecto, haz clic en Tipos de aspecto y plantillas de etiquetas.
En el caso de la plantilla de etiqueta propagada desde Data Catalog, haz clic en > Permisos.
Haz clic en Agregar principales.
Agrega un principal nuevo y asígnale los roles requeridos.
Haz clic en Guardar.
Para configurar los permisos de IAM de Dataplex para los grupos de entradas, haz clic en Grupos de entradas.
En el grupo de entradas propagado desde Data Catalog, haz clic en > Permisos.
Haz clic en Agregar principales.
Agrega un principal nuevo y asígnale los roles requeridos.
Haz clic en Guardar.
REST
Para configurar los permisos de IAM de Dataplex para los tipos de aspectos, usa el método aspectTypes.setIamPolicy
.
Para configurar los permisos de IAM de Dataplex para los grupos de entradas, usa el método entryGroups.setIamPolicy
.
Fase de transferencia
Esta fase incluye tareas para mover el estado activo (read-write
) de tus metadatos personalizados de Data Catalog al catálogo universal.
Los siguientes son los puntos clave que debes recordar durante la fase de transferencia:
- La página Búsqueda de Dataplex dirige a la búsqueda del catálogo universal de forma predeterminada.
- Puedes descubrir y leer los metadatos de Data Catalog y del catálogo universal en el catálogo universal.
- Para actualizar los metadatos en la consola de Google Cloud, se te redireccionará a su fuente. Por ejemplo, si actualizas las plantillas de etiquetas de Data Catalog, se te redireccionará a la página de plantillas de etiquetas en Data Catalog.
Configura la experiencia de IU de catálogo predeterminada en el catálogo universal
Si estableces la experiencia de IU de catálogo predeterminada en el catálogo universal, ocurrirá lo siguiente:
Cuando vayas a la página Búsqueda de Dataplex en la consola de Google Cloud, la búsqueda del catálogo universal (Dataplex Catalog) se mostrará de forma predeterminada. La búsqueda del catálogo universal opera en el catálogo universal y encuentra todo el contenido de metadatos, incluido el contenido creado en el catálogo universal y el contenido importado de Data Catalog.
La búsqueda de Data Catalog solo encuentra contenido de Data Catalog, no contenido del catálogo universal. Por lo tanto, te recomendamos que uses la búsqueda del catálogo universal.
La interfaz web te recomienda crear recursos nuevos en el catálogo universal (Dataplex Catalog). Por ejemplo, de forma predeterminada, se usa Crear tipos de aspectos en lugar de Crear plantillas de etiquetas y Crear grupo de entradas (Dataplex Catalog) en lugar de Crear grupo de entradas (Data Catalog).
Establecer la experiencia de IU de catálogo predeterminada en el catálogo universal suele ser una operación unidireccional. Sin embargo, Dataplex te permite revertir los cambios en casos excepcionales, por ejemplo, cuando deseas volver a cambiar la experiencia de IU de Catalog predeterminada a Data Catalog. Si reviertes los cambios, no podrás acceder a ningún contenido creado en el catálogo universal en la interfaz web de Data Catalog.
Para establecer la experiencia de IU de catálogo predeterminada en el catálogo universal, sigue estos pasos:
Console
En la consola de Google Cloud, ve a la página Catálogo de Dataplex.
Haz clic en Administrar la transición a Dataplex.
Haz clic en la pestaña Experiencia de IU de catálogo predeterminada.
Haz clic en Establecer la experiencia de IU de catálogo predeterminada en Dataplex Catalog.
REST
Para establecer la experiencia de IU de catálogo predeterminada en el catálogo universal, usa el método setConfig
.
Cómo transferir metadatos personalizados de Data Catalog al catálogo universal
Puedes transferir las plantillas de etiquetas públicas de Data Catalog (que habilitaste) y los grupos de entradas personalizados al catálogo universal. Asegúrate de transferir cada plantilla de etiqueta y cada grupo de entradas personalizado por separado.
A continuación, se resume el proceso de transferencia:
Efecto
- Transfiere el estado activo de los recursos de Data Catalog al catálogo universal. Después de la transferencia, para modificar el recurso o acceder a su estado actual, debes usar el catálogo universal.
Cambios en el contenido y el flujo de datos
- Marca el recurso como
read-only
en Data Catalog. - Marca el recurso como
read-write
en el catálogo universal. - Detiene la disponibilidad simultánea de este recurso.
- Marca el recurso como
Dependencias
- Si transfieres una plantilla de etiqueta, también se transferirán todas las etiquetas que la usen.
- Cuando se transfieren grupos de entradas, también se transfieren todas las entradas que contienen.
- La transferencia de entradas no afecta el estado de transferencia de sus etiquetas y sus respectivas plantillas de etiquetas.
Antes de la transferencia, para modificar el contexto empresarial de una entrada (por ejemplo, overview
, contacts
), puedes usar las APIs de Data Catalog y Dataplex. Después de la transferencia, debes usar solo la API de Dataplex.
A continuación, se describen las operaciones permitidas para una entrada personalizada de Data Catalog que está etiquetada, según el estado de transferencia del grupo de entradas personalizado y la plantilla de etiquetas relacionados:
- Cuando una plantilla de etiqueta está activa en Data Catalog, puedes usarla para crear etiquetas. Después de transferir la plantilla de etiquetas al catálogo universal, no podrás usarla para crear etiquetas en Data Catalog.
- Puedes crear aspectos con tipos de aspectos que se propagan desde las plantillas de etiquetas de Data Catalog solo después de transferir las plantillas de etiquetas.
Para transferir las plantillas de etiquetas y los grupos de entradas personalizados de Data Catalog al catálogo universal, sigue estos pasos:
Console
Asegúrate de que hayan pasado al menos 48 horas después de la habilitación antes de transferir las plantillas de etiquetas de Data Catalog al catálogo universal. Este tiempo es necesario para el procesamiento interno.
En la consola de Google Cloud, ve a la página Catálogo de Dataplex.
Haz clic en Administrar la transición a Dataplex.
Haz clic en la pestaña Transferir a Dataplex.
Para transferir plantillas de etiquetas de Data Catalog al catálogo universal, haz clic en Ver tipos de aspectos y plantillas de etiquetas.
Selecciona las plantillas de etiquetas que deseas transferir.
Haz clic en Transferir.
En el cuadro de diálogo Confirmación, haz clic en Confirmar.
Para transferir grupos de entradas personalizados de Data Catalog al catálogo universal, haz clic en Ver grupos de entradas.
Selecciona los grupos de entrada que deseas transferir.
Haz clic en Transferir.
En el cuadro de diálogo Confirmación, haz clic en Confirmar.
REST
Asegúrate de que hayan pasado al menos 48 horas después de la habilitación antes de transferir las plantillas de etiquetas de Data Catalog al catálogo universal. Este tiempo es necesario para el procesamiento interno.
Luego, para transferir plantillas de etiquetas y grupos de entradas personalizados de Data Catalog
al catálogo universal, usa el método
tagTemplates.patch
.
Cuando completes la fase de transferencia, el catálogo universal se convertirá en la fuente autorizada para todos tus metadatos, y no necesitarás usar Data Catalog.
Actualiza las cargas de trabajo programáticas
El catálogo universal incluye una API, bibliotecas cliente, módulos de Terraform y comandos de Google Cloud CLI nuevos. Por lo tanto, debes actualizar las cargas de trabajo existentes con el uso programático de Data Catalog al catálogo universal. Consulta las muestras de código de Dataplex.
Asegúrate de alinear la actualización de las cargas de trabajo programáticas con la transferencia de los recursos dependientes, como las plantillas de etiquetas y los grupos de entradas personalizados. Esto es
necesario porque la transferencia mueve el estado activo (read-write
) de un
recurso de Data Catalog al catálogo universal.
La siguiente es una secuencia de ejemplo para actualizar cargas de trabajo programáticas para interactuar con el catálogo universal, coordinada con la transferencia de los recursos dependientes:
Si tus cargas de trabajo pueden tolerar la coherencia eventual, mueve las operaciones
read
de las cargas de trabajo al catálogo universal.Mueve las cargas de trabajo que realizan operaciones de etiquetado
write
al catálogo universal coordinadas con la transferencia de sus plantillas de etiquetas correspondientes.Mueve las cargas de trabajo que realizan operaciones de transferencia
write
personalizadas al catálogo universal coordinadas con la transferencia de los respectivos grupos de entradas personalizados.
Si necesitas desacoplar la actualización de cargas de trabajo y la transferencia de los recursos correspondientes, considera implementar lógica dentro de las cargas de trabajo para enrutar read-write
a Data Catalog o al catálogo universal en el estado de transferencia de recursos. Por lo tanto, las cargas de trabajo operarán independientemente del estado de transferencia del recurso relacionado.
¿Qué sigue?
- Obtén más información sobre el catálogo universal.
- Obtén información para buscar recursos en el catálogo universal.
- Obtén más información para administrar aspectos y enriquecer metadatos en el catálogo universal.
- Obtén más información para administrar entradas y transferir fuentes personalizadas al catálogo universal.
- Consulta la referencia de la API del catálogo universal.