Si usas Data Catalog, puedes migrar tu contenido y uso de Data Catalog al Catálogo universal de Dataplex siguiendo los pasos que se describen en este documento.
Si es la primera vez que usas el catálogo, comienza con Dataplex Universal Catalog. Para ello, configúralo como tu experiencia de catálogo predeterminada.
Este documento está dirigido a administradores y custodios de datos.
Dataplex Universal Catalog tiene una API y una interfaz web unificadas. La transición a Dataplex Universal Catalog permite que tus cargas de trabajo y usuarios existentes y futuros se beneficien de sus funciones y capacidades mejoradas. Para obtener más información, consulta Acerca de la administración del catálogo de datos en Dataplex Universal Catalog.
Para comparar Dataplex Universal Catalog y Data Catalog, consulta Dataplex Universal Catalog en comparación con Data Catalog.
Antes de comenzar la transición, revisa las funciones de administración de metadatos que no son compatibles con Dataplex Universal Catalog.
Descripción general de la transición
La página Administrar la transición a Dataplex en la Google Cloud consola proporciona un punto de acceso único para administrar la transición.
En esta sección, se describen los diversos casos de transición y se describe el proceso de transición para cada uno de ellos.
Si no tienes metadatos personalizados en Data Catalog o si nunca lo usaste
Si usas Data Catalog y no tienes metadatos personalizados, como etiquetas, plantillas de etiquetas, entradas personalizadas o grupos de entradas, o si nunca usaste Data Catalog, completa la transición configurando la experiencia de IU de catálogo predeterminada en Dataplex Universal Catalog.
Si tienes metadatos personalizados de Data Catalog o cargas de trabajo programáticas
Si usas Data Catalog con metadatos personalizados (como etiquetas,
plantillas de etiquetas, entradas personalizadas o grupos de entradas), Dataplex Universal Catalog puede importar
automáticamente estos metadatos personalizados
como read-only
. Para habilitar esta función, se requieren cambios en la configuración, como se describe en la fase preparatoria.
La segunda fase es la fase de actualización, en la que el estado activo (read-write
) de tus metadatos personalizados se traslada a Dataplex Universal Catalog. Durante esta fase, también debes actualizar las cargas de trabajo programáticas (como la API, las bibliotecas cliente, los módulos de Terraform y los comandos de Google Cloud CLI) para interactuar con el Catálogo universal de Dataplex.
A continuación, se proporcionan más detalles sobre cada fase del proceso de transición:
Fase preparatoria: Realiza las tareas de configuración necesarias para que el contenido de Data Catalog esté disponible de forma simultánea en Dataplex Universal Catalog como
read-only
. Durante esta fase, Data Catalog sigue siendo la fuente autorizada para tu contenido de metadatos.La fase preparatoria incluye las siguientes tareas:
- Actualiza las plantillas de etiquetas privadas de Data Catalog a públicas.
- Habilita las etiquetas y plantillas de etiquetas para que los metadatos estén disponibles de forma simultánea en Dataplex Universal Catalog.
- Configura los permisos de IAM de Dataplex Universal Catalog para tus metadatos personalizados.
Para obtener más información, consulta Fase preparatoria.
Fase de actualización: Traslada el uso del catálogo y el estado activo (
read-write
) de tus metadatos personalizados a Dataplex Universal Catalog.La fase de actualización incluye las siguientes tareas:
- Establece la experiencia de IU de catálogo predeterminada en Dataplex Universal Catalog.
Actualiza los metadatos personalizados de Data Catalog a Dataplex Universal Catalog.
Debes esperar al menos 48 horas después de habilitar las plantillas de etiquetas y las etiquetas para poder actualizar los metadatos personalizados. Este tiempo es necesario para el procesamiento interno.
Actualiza las cargas de trabajo programáticas.
Cuando completes la fase de actualización, Dataplex Universal Catalog se convertirá en la fuente autorizada para todos tus metadatos y no necesitarás usar Data Catalog.
Para obtener más información, consulta Fase de actualización.
Roles obligatorios
Para obtener los permisos que necesitas para realizar la transición de Data Catalog a Dataplex Universal Catalog, otorga los siguientes roles de IAM en el recurso:
Actualiza las plantillas de etiquetas privadas a públicas: Propietario de TagTemplate de Data Catalog (
roles/datacatalog.tagTemplateOwner
)Este rol predefinido contiene el permiso
datacatalog.tagTemplates.update
, que se requiere para actualizar las plantillas de etiquetas privadas a públicas.Habilita las plantillas de etiquetas y etiquetas públicas para la disponibilidad simultánea de metadatos en Dataplex Universal Catalog: Administrador de la configuración de migración de DataCatalog (
roles/datacatalog.migrationConfigAdmin
).Este rol predefinido contiene el permiso
datacatalog.migrationConfig.set
, que es necesario para habilitar las plantillas y las etiquetas.Establece la experiencia de IU de catálogo predeterminada en Dataplex Universal Catalog: Administrador de la configuración de migración de DataCatalog (
roles/datacatalog.migrationConfigAdmin
).Este rol predefinido contiene el permiso
datacatalog.migrationConfig.set
, que se requiere para configurar la experiencia predeterminada de la IU del catálogo.Actualiza las plantillas de etiquetas públicas de Data Catalog a Dataplex Universal Catalog: Propietario de TagTemplate de Data Catalog (
roles/datacatalog.tagTemplateOwner
)Este rol predefinido contiene el permiso
datacatalog.tagTemplates.update
, que se requiere para actualizar las plantillas de etiquetas públicas.Actualiza los grupos de entradas de Data Catalog a Dataplex Universal Catalog: Propietario de DataCatalog EntryGroup (
roles/datacatalog.entryGroupOwner
)Este rol predefinido contiene el permiso
datacatalog.entryGroups.update
, que se requiere para actualizar los grupos de entrada.
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
También puedes obtener los permisos necesarios con roles personalizados o cualquier otro rol predefinido.
Fase preparatoria
Esta fase incluye tareas para que el contenido de metadatos de Data Catalog esté disponible de forma simultánea en Dataplex Universal Catalog, en el modo read-only
.
Los siguientes son los puntos clave que debes recordar durante la fase preparatoria:
- Data Catalog sigue siendo la fuente autorizada para tus metadatos personalizados.
- La página Búsqueda de Dataplex Universal Catalog dirige a la búsqueda de Data Catalog de forma predeterminada, que solo incluye metadatos de Data Catalog y no de Dataplex Universal Catalog.
- Es posible que la búsqueda de Dataplex Universal Catalog no incluya todas las plantillas de etiquetas ni etiquetas públicas de Data Catalog hasta que completes la fase preparatoria.
Más información sobre la disponibilidad simultánea de los metadatos de Data Catalog en Dataplex Universal Catalog
Los grupos de entradas personalizados de Data Catalog y sus entradas ya están disponibles de forma simultánea en Dataplex Universal Catalog como read-only
. Cuando
habilitas las etiquetas y plantillas de etiquetas públicas
en la fase preparatoria, su contenido estará disponible de forma simultánea en
el Catálogo universal de Dataplex como read-only
.
En la siguiente tabla, se muestra la asignación entre los recursos de Data Catalog y Dataplex Universal Catalog cuando los recursos de Data Catalog están disponibles de forma simultánea en Dataplex Universal Catalog:
Recurso de Data Catalog | Recurso correspondiente de Dataplex Universal Catalog | Descripción |
---|---|---|
Plantilla de etiqueta | Tipo de aspecto (global) | Las plantillas de etiquetas de Data Catalog son recursos regionales. Cuando habilitas las plantillas de etiquetas, su contenido está disponible de forma simultánea como tipos de aspecto globales en el Catálogo universal de Dataplex. Esto se hace para preservar las referencias entre regiones entre las etiquetas y las plantillas de etiquetas. Las definiciones de los tipos de aspectos globales se replican en todas las regiones de Google Cloud . Los conceptos estándar, como |
Etiqueta | Aspecto opcional | Cuando habilitas las plantillas de etiquetas, sus etiquetas están disponibles de forma simultánea como aspectos opcionales en el Catálogo universal de Dataplex. Para obtener más información, consulta Categorías de aspectos. |
Grupo de entradas | Grupo de entradas | Los grupos de entradas para las entradas del sistema se establecen por proyecto y por región en Dataplex Universal Catalog. Los grupos de entradas creados en Data Catalog están disponibles de forma simultánea en Dataplex Universal Catalog. |
Entrada personalizada | Entrada personalizada | Todas las entradas personalizadas de Data Catalog están disponibles de forma simultánea
como entradas de GenericEntryType en
Dataplex Universal Catalog.
Para obtener más información, consulta Categorías de tipos de entrada.
|
Entrada del sistema (Google Cloud) | Aspecto obligatorio de entrada del sistema | Los metadatos que describen las entradas del sistema, como Schema para las tablas de BigQuery, se capturan en los aspectos obligatorios de los tipos de aspectos definidos por el sistema.
|
Actualiza las plantillas de etiquetas privadas de Data Catalog a públicas
Dataplex Universal Catalog no admite el concepto de aspectos privados (equivalentes a las etiquetas privadas). Por lo tanto, las etiquetas y plantillas de etiquetas privadas no están disponibles de forma simultánea en el Catálogo universal de Dataplex. Para propagar plantillas de etiquetas privadas y etiquetas en Dataplex Universal Catalog, debes actualizarlas a públicas.
Antes de continuar, revisa la estructura de las plantillas de etiquetas privadas para verificar que su estructura y metadatos sean coherentes con la visibilidad de las etiquetas públicas.
Para actualizar las plantillas de etiquetas privadas y las etiquetas a públicas, sigue estos pasos:
Console
En la consola de Google Cloud , ve a la página Catalog del Catálogo universal de Dataplex.
Haz clic en Administrar la transición a Dataplex.
Haz clic en la pestaña Plantillas de etiquetas privadas.
Haz clic en Administrar plantillas de etiquetas.
En la página Plantillas de etiquetas, haz clic en la plantilla de etiqueta privada que deseas actualizar.
En la página Detalles de la plantilla, haz clic en Editar.
En la sección Visibilidad, selecciona Público.
Haz clic en Actualizar.
REST
Para actualizar las plantillas de etiquetas privadas a públicas, usa el método tagTemplates.patch
.
Habilita las etiquetas y plantillas de etiquetas públicas para que los metadatos estén disponibles de forma simultánea en el catálogo universal de Dataplex
Cuando habilitas esta opción, el contenido de las etiquetas y plantillas de etiquetas públicas de Data Catalog se propaga de forma automática y continua al Catálogo universal de Dataplex en tu Google Cloud organización o proyecto. Las etiquetas y plantillas de etiquetas públicas de Data Catalog se propagan a Dataplex Universal Catalog como tipos de aspectos y aspectos públicos, respectivamente. Las definiciones de los tipos de aspectos globales se replican en todas las regiones de Google Cloud .
Para habilitar las etiquetas y plantillas de etiquetas públicas, sigue estos pasos:
Console
En la consola de Google Cloud , ve a la página Catalog del catálogo universal de Dataplex.
Haz clic en Administrar la transición a Dataplex.
Haz clic en la pestaña Habilitar.
Haz clic en Proporcionar la habilitación.
En el cuadro de diálogo de confirmación, ingresa el texto que se muestra y haz clic en Confirmar.
REST
Para habilitar las plantillas de etiquetas y las etiquetas, usa el método setConfig
.
En el caso de las Google Cloud organizaciones y los proyectos, puedes revocar la aceptación proporcionada originalmente haciendo clic en Revocar aceptación. Cuando revocas la habilitación, se detiene el proceso de propagación de las etiquetas y plantillas de etiquetas de Data Catalog al Catálogo universal de Dataplex. Se borrarán los tipos de aspectos y aspectos de Dataplex Universal Catalog que se creen a través del proceso de habilitación, pero que no se actualicen a Dataplex Universal Catalog. El proceso de eliminación puede tardar hasta 12 horas.
Configura los permisos de IAM de Dataplex Universal Catalog para tus metadatos personalizados
Los tipos de aspectos y los grupos de entradas personalizados del Catálogo universal de Dataplex que representan plantillas de etiquetas y grupos de entradas de Data Catalog no heredan los permisos de IAM originales de Data Catalog. Debes configurar manualmente los permisos de IAM de Dataplex Universal Catalog para esos tipos de aspectos y grupos de entradas personalizados.
Por ejemplo, si deseas crear aspectos con un tipo de aspecto propagado (que representa una plantilla de etiqueta de Data Catalog), debes configurar los permisos de IAM necesarios para ese tipo de aspecto. Del mismo modo, cuando transfieres metadatos personalizados, para crear entradas personalizadas dentro de un grupo de entradas personalizado propagado, debes configurar los permisos de IAM necesarios para ese grupo de entradas.
Para obtener más información sobre cómo los permisos de IAM de Data Catalog corresponden a los del catálogo universal de Dataplex, consulta Asignación de permisos de IAM entre Data Catalog y el catálogo universal de Dataplex.
Para configurar los permisos de IAM necesarios de Dataplex Universal Catalog para los tipos de aspectos y los grupos de entradas personalizados, sigue estos pasos:
Console
En la consola de Google Cloud , ve a la página Catalog del Catálogo universal de Dataplex.
Haz clic en Administrar la transición a Dataplex.
Haz clic en la pestaña Permisos de IAM de Dataplex.
Para configurar los permisos de IAM de Dataplex Universal Catalog para los tipos de aspectos, haz clic en Tipos de aspectos y plantillas de etiquetas.
En el caso de la plantilla de etiqueta propagada desde Data Catalog, haz clic en > Permisos.
Haz clic en Agregar principales.
Agrega un principal nuevo y asígnale los roles requeridos.
Haz clic en Guardar.
Para configurar los permisos de IAM de Dataplex Universal Catalog para los grupos de entradas, haz clic en Grupos de entradas.
En el grupo de entradas propagado desde Data Catalog, haz clic en > Permisos.
Haz clic en Agregar principales.
Agrega un principal nuevo y asígnale los roles requeridos.
Haz clic en Guardar.
REST
Para configurar los permisos de IAM de Dataplex Universal Catalog para los tipos de aspectos, usa el método aspectTypes.setIamPolicy
.
Para configurar los permisos de IAM de Dataplex Universal Catalog para los grupos de entradas, usa el método entryGroups.setIamPolicy
.
Fase de actualización
Esta fase incluye tareas para mover el estado activo (read-write
) de tus metadatos personalizados de Data Catalog a Dataplex Universal Catalog.
Estos son los puntos clave que debes recordar durante la fase de actualización:
- La página Búsqueda de Dataplex Universal Catalog dirige a la búsqueda de Dataplex Universal Catalog de forma predeterminada.
- Puedes descubrir y leer los metadatos de Data Catalog y Dataplex Universal Catalog en Dataplex Universal Catalog.
- Para actualizar los metadatos en la Google Cloud consola, se te redireccionará a su fuente. Por ejemplo, si actualizas las plantillas de etiquetas de Data Catalog, se te redireccionará a la página de plantillas de etiquetas en Data Catalog.
Establecer la experiencia de IU de catálogo predeterminada en Dataplex Universal Catalog
Si estableces la experiencia de IU de catálogo predeterminada en Dataplex Universal Catalog, ocurrirá lo siguiente:
Cuando vayas a la página Búsqueda del catálogo universal de Dataplex en la consola deGoogle Cloud , se mostrará la búsqueda del catálogo universal de Dataplex (Dataplex Catalog) de forma predeterminada. La búsqueda de Dataplex Universal Catalog opera en Dataplex Universal Catalog y encuentra todo tu contenido de metadatos, incluido el contenido creado en Dataplex Universal Catalog y el contenido que se importa desde Data Catalog.
La búsqueda de Data Catalog solo encuentra contenido de Data Catalog, no de Dataplex Universal Catalog. Por lo tanto, te recomendamos que uses la búsqueda de Dataplex Universal Catalog.
La interfaz web te recomienda crear recursos nuevos en el catálogo universal de Dataplex (Dataplex Catalog). Por ejemplo, la opción predeterminada es Crear tipos de aspectos en lugar de Crear plantillas de etiquetas y Crear grupo de entradas (Dataplex Catalog) en lugar de Crear grupo de entradas (Data Catalog).
Establecer la experiencia de IU de catálogo predeterminada en Dataplex Universal Catalog suele ser una operación unidireccional. Sin embargo, Dataplex Universal Catalog te permite revertir los cambios en casos excepcionales, por ejemplo, cuando quieras volver a cambiar la experiencia predeterminada de la IU de Catalog a Data Catalog. Si reviertes los cambios, no podrás acceder a ningún contenido creado en Dataplex Universal Catalog, en la interfaz web de Data Catalog.
Para establecer la experiencia de IU de catálogo predeterminada en el catálogo universal de Dataplex, sigue estos pasos:
Console
En la consola de Google Cloud , ve a la página Catalog del Catálogo universal de Dataplex.
Haz clic en Administrar la transición a Dataplex.
Haz clic en la pestaña Experiencia de IU de catálogo predeterminada.
Haz clic en Establecer la experiencia de IU de catálogo predeterminada en Dataplex Catalog.
REST
Para establecer la experiencia de IU de catálogo predeterminada en Dataplex Universal Catalog, usa el método setConfig
.
Actualiza los metadatos personalizados de Data Catalog a Dataplex Universal Catalog
Puedes actualizar las plantillas de etiquetas públicas de Data Catalog (que habilitaste) y los grupos de entradas personalizados a Dataplex Universal Catalog. Asegúrate de actualizar cada plantilla de etiqueta y cada grupo de entradas personalizado por separado.
A continuación, se resume el proceso de actualización:
Efecto
- Transfiere el estado activo de los recursos de Data Catalog al catálogo universal de Dataplex. Después de la actualización, para modificar el recurso o acceder a su estado actual, debes usar Dataplex Universal Catalog.
Cambios en el contenido y el flujo de datos
- Marca el recurso como
read-only
en Data Catalog. - Marca el recurso como
read-write
en Dataplex Universal Catalog. - Detiene la disponibilidad simultánea de este recurso.
- Marca el recurso como
Dependencias
- Si actualizas una plantilla de etiqueta, también se actualizarán todas las etiquetas que la usen.
- Cuando se actualizan los grupos de entradas, también se actualizan todas las entradas de ese grupo.
- La actualización de entradas no afecta el estado de actualización de sus etiquetas y sus respectivas plantillas de etiquetas.
Antes de la actualización, para modificar el contexto comercial de una entrada (por ejemplo, overview
, contacts
), puedes usar la API de Data Catalog y la API de Dataplex. Después de la actualización, debes usar solo la
API de Dataplex.
A continuación, se describen las operaciones permitidas para una entrada personalizada de Data Catalog que está etiquetada, según el estado de actualización del grupo de entradas personalizadas y la plantilla de etiquetas relacionados:
- Cuando una plantilla de etiqueta está activa en Data Catalog, puedes usarla para crear etiquetas. Después de actualizar la plantilla de etiquetas a Dataplex Universal Catalog, no podrás usarla para crear etiquetas en Data Catalog.
- Puedes crear aspectos con tipos de aspectos que se propagan desde las plantillas de etiquetas de Data Catalog solo después de actualizarlas.
Para actualizar las plantillas de etiquetas y los grupos de entradas personalizados de Data Catalog a Dataplex Universal Catalog, sigue estos pasos:
Console
Asegúrate de que hayan pasado al menos 48 horas después de la habilitación antes de actualizar las plantillas de etiquetas de Data Catalog a Dataplex Universal Catalog. Este tiempo es necesario para el procesamiento interno.
En la consola de Google Cloud , ve a la página Catalog del Catálogo universal de Dataplex.
Haz clic en Administrar la transición a Dataplex Universal Catalog.
Haz clic en la pestaña Upgrade to Dataplex.
Para actualizar las plantillas de etiquetas de Data Catalog a Dataplex Universal Catalog, haz clic en Ver tipos de aspectos y plantillas de etiquetas.
Selecciona las plantillas de etiquetas que deseas actualizar.
Haz clic en Actualizar.
En el cuadro de diálogo Confirmación, haz clic en Confirmar.
Para actualizar los grupos de entradas personalizados de Data Catalog a Dataplex Universal Catalog, haz clic en Ver grupos de entradas.
Selecciona los grupos de entrada que deseas actualizar.
Haz clic en Actualizar.
En el cuadro de diálogo Confirmación, haz clic en Confirmar.
REST
Asegúrate de que hayan pasado al menos 48 horas después de la habilitación antes de actualizar las plantillas de etiquetas de Data Catalog a Dataplex Universal Catalog. Este tiempo es necesario para el procesamiento interno.
Luego, para actualizar las plantillas de etiquetas y los grupos de entradas personalizados de Data Catalog a Dataplex Universal Catalog, usa el método tagTemplates.patch
.
Cuando completes la fase de actualización, Dataplex Universal Catalog se convertirá en la fuente autorizada para todos tus metadatos, y no necesitarás usar Data Catalog.
Actualiza las cargas de trabajo programáticas
Dataplex Universal Catalog incluye una nueva API, bibliotecas cliente, módulos de Terraform y comandos de Google Cloud CLI. Por lo tanto, debes actualizar las cargas de trabajo existentes con el uso programático de Data Catalog al catálogo universal de Dataplex. Consulta las muestras de código de Dataplex Universal Catalog.
Asegúrate de alinear la actualización de las cargas de trabajo programáticas con la actualización de los recursos dependientes, como las plantillas de etiquetas y los grupos de entradas personalizados. Esto es necesario porque la actualización mueve el estado activo (read-write
) de un recurso de Data Catalog a Dataplex Universal Catalog.
La siguiente es una secuencia de ejemplo para actualizar cargas de trabajo programáticas para interactuar con Dataplex Universal Catalog, coordinada con la actualización de los recursos dependientes:
Si tus cargas de trabajo pueden tolerar la coherencia eventual, mueve las operaciones
read
de las cargas de trabajo a Dataplex Universal Catalog.Traslada las cargas de trabajo que realizan operaciones de etiquetado
write
a Dataplex Universal Catalog de forma coordinada con la actualización de sus plantillas de etiquetas correspondientes.Traslada las cargas de trabajo que realizan operaciones de transferencia
write
personalizadas a Dataplex Universal Catalog de forma coordinada con la actualización de los correspondientes grupos de entradas personalizados.
Si necesitas desacoplar la actualización de cargas de trabajo y la actualización de los recursos correspondientes, considera implementar la lógica dentro de las cargas de trabajo para enrutar read-write
a Data Catalog o Dataplex Universal Catalog según el estado de actualización de los recursos. Por lo tanto, las cargas de trabajo operarán independientemente del estado de actualización del recurso relacionado.
¿Qué sigue?
- Obtén más información sobre la administración de metadatos en Dataplex Universal Catalog.
- Obtén información para buscar recursos en Dataplex Universal Catalog.
- Obtén más información para administrar aspectos y enriquecer metadatos.
- Obtén más información para administrar entradas y transferir fuentes personalizadas.
- Consulta la referencia de la API de Dataplex.