Perfila datos de Vertex AI en un solo proyecto

En esta página, se describe cómo configurar el descubrimiento de datos de Vertex AI a nivel del proyecto. Si deseas generar perfiles de una organización o carpeta, consulta Cómo generar perfiles de datos de Vertex AI en una organización o carpeta.

Para obtener más información sobre el servicio de descubrimiento, consulta Perfiles de datos.

Antes de comenzar

  1. Asegúrate de que la API de Cloud Data Loss Prevention esté habilitada en tu proyecto:

    1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
    2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

      Go to project selector

    3. Make sure that billing is enabled for your Google Cloud project.

    4. Enable the required API.

      Enable the API

    5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

      Go to project selector

    6. Make sure that billing is enabled for your Google Cloud project.

    7. Enable the required API.

      Enable the API

    8. Confirma que tienes los permisos de IAM necesarios para configurar los perfiles de datos a nivel del proyecto.

    9. Debes tener una plantilla de inspección en cada región en la que tengas datos para generar perfiles. Si deseas usar una sola plantilla para varias regiones, puedes usar una plantilla que se almacene en la región global. Si las políticas de la organización te impiden crear una plantilla de inspección en la región global, debes establecer una plantilla de inspección dedicada para cada región. Para obtener más información, consulta Consideraciones sobre la residencia de datos.

      Esta tarea te permite crear una plantilla de inspección solo en la región global. Si necesitas plantillas de inspección específicas para una o más regiones, debes crear esas plantillas antes de realizar esta tarea.

    10. Puedes configurar la Protección de datos sensibles para que envíe notificaciones a Pub/Sub cuando ocurran ciertos eventos, como cuando la Protección de datos sensibles genera el perfil de un nuevo conjunto de datos. Si deseas usar esta función, primero debes crear un tema de Pub/Sub.

    11. Crear una configuración de análisis

      1. Ve a la página Crear configuración de análisis.

        Ir a Crear configuración de análisis

      2. Ve a tu proyecto. En la barra de herramientas, haz clic en el selector de proyectos y selecciona tu proyecto.

      En las siguientes secciones, se proporciona más información sobre los pasos que se indican en la página Crear configuración de análisis. Al final de cada sección, haz clic en Continuar.

      Selecciona un tipo de descubrimiento

      Selecciona Vertex AI.

      Selecciona el permiso

      Realiza una de las siguientes acciones:

      • Si deseas analizar un solo conjunto de datos, selecciona Analizar un conjunto de datos.

        Para cada conjunto de datos, solo puedes tener una configuración de análisis de un solo recurso. Para obtener más información, consulta Cómo generar el perfil de un solo recurso de datos.

        Completa los detalles del conjunto de datos que deseas crear como perfil.

      • Si deseas realizar un análisis estándar a nivel del proyecto, selecciona Analizar el proyecto seleccionado.

      Administrar programas

      Si la frecuencia de generación de perfiles predeterminada satisface tus necesidades, puedes omitir esta sección de la página Crear configuración de análisis.

      Configura esta sección por los siguientes motivos:

      • Realizar ajustes precisos en la frecuencia de generación de perfiles de todos tus datos o de ciertos subconjuntos de datos
      • Especifica los conjuntos de datos para los que no deseas crear perfiles.
      • Especificar los conjuntos de datos que no deseas que se generen perfiles más de una vez

      Para realizar ajustes precisos en la frecuencia de generación de perfiles, sigue estos pasos:

      1. Haz clic en Agregar programa.
      2. En la sección Filtros, define uno o más filtros que especifiquen qué conjuntos de datos se encuentran dentro del alcance de la programación. Se considera que un conjunto de datos está dentro del alcance de la programación si coincide con al menos uno de los filtros definidos.

        Para configurar un filtro, especifica un ID del proyecto o una expresión regular que especifique uno o más proyectos.

        Las expresiones regulares deben seguir la sintaxis RE2.

        Por ejemplo, si deseas que todos los conjuntos de datos de un proyecto se incluyan en el filtro, ingresa el ID del proyecto en el campo ID del proyecto.

        Si quieres agregar más filtros, haz clic en Agregar filtro y repite este paso.

      3. Haz clic en Frecuencia.

      4. En la sección Frecuencia, especifica si el servicio de detección debe generar perfiles de los conjuntos de datos que seleccionaste y, si es así, con qué frecuencia:

        • Si no quieres que se generen perfiles de los conjuntos de datos, desactiva Generar perfil de estos datos.

        • Si quieres que se generen perfiles de los conjuntos de datos al menos una vez, deja activada la opción Generar perfil de estos datos.

          En los campos siguientes de esta sección, debes especificar si el sistema debe volver a generar el perfil de tus datos y qué eventos deben activar una operación de regeneración del perfil. Para obtener más información, consulta Frecuencia de generación de perfiles de datos.

          1. En Según un programa, especifica con qué frecuencia deseas que se vuelvan a generar los perfiles de los conjuntos de datos. Los conjuntos de datos se vuelven a generar, independientemente de si sufrieron algún cambio.
          2. En Cuando inspeccionas cambios en la plantilla, especifica si deseas que se vuelva a generar el perfil de tus datos cuando se actualice la plantilla de inspección asociada y, si es así, con qué frecuencia.

            Se detecta un cambio en la plantilla de inspección cuando ocurre alguna de las siguientes situaciones:

            • El nombre de una plantilla de inspección cambia en tu configuración de análisis.
            • El updateTime de una plantilla de inspección cambia.

          3. Por ejemplo, si estableces una plantilla de inspección para la región us-west1 y actualizas esa plantilla, solo se volverá a generar el perfil de los datos de la región us-west1.

      5. Opcional: Haz clic en Condiciones.

        En la sección Condiciones, especifica las condiciones que deben cumplir los conjuntos de datos (definidos en tus filtros) antes de que Sensitive Data Protection genere sus perfiles.

        Si es necesario, establece lo siguiente:

        • Condición mínima: Si quieres retrasar la generación de perfiles de un conjunto de datos hasta que alcance una cierta antigüedad, activa esta opción. Luego, ingresa la duración mínima.

        • Condición de tiempo: Activa esta opción si no quieres que se generen perfiles de conjuntos de datos antiguos. Luego, usa el selector de fecha para seleccionar una fecha y hora. Cualquier conjunto de datos creado en la marca de tiempo seleccionada o antes se excluye de la generación de perfiles.

        Condiciones de ejemplo

        Supongamos que tienes la siguiente configuración:

        • Condiciones mínimas

          • Duración mínima: 24 horas
        • Condición de tiempo

          • Marca de tiempo: 04/05/22, 11:59 p.m.

        En este caso, la Protección de datos sensibles excluye cualquier conjunto de datos que se haya creado antes del 4 de mayo de 2022 a las 23:59 (UTC-7). Entre los conjuntos de datos que se crearon después de esa fecha y hora, Sensitive Data Protection solo genera perfiles de los conjuntos de datos que tienen al menos 24 horas de antigüedad.

      6. Haz clic en Listo.

      7. Opcional: Para agregar más programaciones, haz clic en Agregar programación y repite los pasos anteriores.

      8. Para especificar la precedencia entre los programas, reordénalos con las flechas hacia arriba y hacia abajo .

        El orden de las programaciones especifica cómo se resuelven los conflictos entre ellas. Si un conjunto de datos coincide con los filtros de dos programas diferentes, el programa que se encuentre más arriba en la lista de programas determinará la frecuencia de generación de perfiles para ese conjunto de datos.

      9. Opcional: Edita o desactiva la opción Catch-all schedule.

        El último programa de la lista es el programa general. Este programa abarca los conjuntos de datos del alcance seleccionado que no coinciden con ninguno de los programas que creaste. El programa general sigue la frecuencia de creación de perfiles predeterminada del sistema.

        • Para ajustar la programación general, haz clic en Editar programación y, luego, ajusta la configuración según sea necesario.
        • Para evitar que Sensitive Data Protection genere perfiles de los recursos que están cubiertos por el programa general, desactiva Genera un perfil de los recursos que no coinciden con ningún programa personalizado.

      Selecciona una plantilla de inspección

      Según cómo desees proporcionar una configuración de inspección, elige una de las siguientes opciones. Independientemente de la opción que elijas, Sensitive Data Protection analizará tus datos en la región en la que se almacenan. Es decir, tus datos no salen de su región de origen.

      Opción 1: Crea una plantilla de inspección

      Elige esta opción si deseas crear una nueva plantilla de inspección en la región global.

      1. Haz clic en Crear una plantilla de inspección nueva.
      2. Opcional: Para modificar la selección predeterminada de infotipos, haz clic en Administrar infotipos.

        Para obtener más información sobre cómo administrar los Infotipos integrados y personalizados, consulta Administra los Infotipos a través de la consola deGoogle Cloud .

        Debes seleccionar al menos un Infotipo para continuar.

      3. Opcional: Configura aún más la plantilla de inspección agregando conjuntos de reglas y estableciendo un umbral de confianza. Para obtener más información, consulta Configura la detección.

      Cuando Sensitive Data Protection crea la configuración de análisis, almacena esta nueva plantilla de inspección en la región global.

      Opción 2: Usa una plantilla de inspección existente

      Elige esta opción si tienes plantillas de inspección existentes que deseas usar.

      1. Haz clic en Seleccionar plantilla de inspección existente.
      2. Ingresa el nombre completo del recurso de la plantilla de inspección que deseas usar. El campo Región se completa automáticamente con el nombre de la región en la que se almacena tu plantilla de inspección.

        La plantilla de inspección que ingreses debe estar en la misma región que los datos para el perfil.

        Para respetar la residencia de datos, Sensitive Data Protection no usa una plantilla de inspección fuera de la región en la que se almacena esa plantilla.

        Para encontrar el nombre completo del recurso de una plantilla de inspección, sigue estos pasos:

        1. Ve a la lista de plantillas de inspección. Esta página se abrirá en una pestaña aparte.

          Ir a las plantillas de inspección

        2. Cambia al proyecto que contiene la plantilla de inspección que deseas usar.
        3. En la pestaña Plantillas, haz clic en el ID de la plantilla que deseas usar.
        4. En la página que se abre, copia el nombre completo del recurso de la plantilla. El nombre completo del recurso tiene el siguiente formato:
          projects/PROJECT_ID/locations/REGION/inspectTemplates/TEMPLATE_ID
        5. En la página Crear configuración de análisis, en el campo Nombre de la plantilla, pega el nombre completo del recurso de la plantilla.
      3. Para agregar una plantilla de inspección para otra región, haz clic en Agregar plantilla de inspección y, luego, ingresa el nombre completo del recurso de la plantilla. Repite este paso para cada región en la que tengas una plantilla de inspección dedicada.
      4. Opcional: Agrega una plantilla de inspección que se almacene en la región global. Sensitive Data Protection usa automáticamente esa plantilla para los datos de las regiones en las que no tienes una plantilla de inspección dedicada.

      Agregar acciones

      En esta sección, se describe cómo especificar las acciones que deseas que realice la Protección de datos sensibles después de generar el perfil de un conjunto de datos. Estas acciones son útiles si deseas enviar estadísticas recopiladas a partir de los perfiles de datos a otros servicios deGoogle Cloud .

      Publicar en Security Command Center

      Los resultados de los perfiles de datos proporcionan contexto cuando clasificas y desarrollas planes de respuesta para los resultados de vulnerabilidades y amenazas en Security Command Center.

      Para usar esta acción, se debe activar Security Command Center a nivel de la organización. Activar Security Command Center a nivel de la organización permite el flujo de resultados de servicios integrados, como la Protección de datos sensibles. Sensitive Data Protection funciona con Security Command Center en todos los niveles de servicio.

      Si Security Command Center no está activado a nivel de la organización, los hallazgos de Protección de datos sensibles no aparecerán en Security Command Center. Para obtener más información, consulta Verifica el nivel de activación de Security Command Center.

      Para enviar los resultados de tus perfiles de datos a Security Command Center, asegúrate de que la opción Publicar en Security Command Center esté activada.

      Para obtener más información, consulta Publica perfiles de datos en Security Command Center.

      Guardar copias de los perfiles de datos en BigQuery

      La Protección de datos sensibles guarda una copia de cada perfil de datos generado en una tabla de BigQuery. Si no proporcionas los detalles de tu tabla preferida, Sensitive Data Protection creará un conjunto de datos y una tabla en el proyecto. De forma predeterminada, el conjunto de datos se llama sensitive_data_protection_discovery y la tabla se llama discovery_profiles.

      Esta acción te permite mantener un historial de todos los perfiles que generaste. Este historial puede ser útil para crear informes de auditoría y visualizar perfiles de datos. También puedes cargar esta información en otros sistemas.

      Además, esta opción te permite ver todos tus perfiles de datos en una sola vista, independientemente de la región en la que residan tus datos. Si bien también puedes ver los perfiles de datos a través de laGoogle Cloud consola, esta muestra los perfiles de una sola región a la vez.

      Cuando la Protección de datos sensibles no puede crear un perfil de un conjunto de datos, vuelve a intentarlo periódicamente. Para minimizar el ruido en los datos exportados, Sensitive Data Protection solo exporta a BigQuery los perfiles que se generaron correctamente.

      Sensitive Data Protection comienza a exportar perfiles desde el momento en que activas esta opción. Los perfiles que se generaron antes de que activaras la exportación no se guardan en BigQuery.

      Para ver ejemplos de consultas que puedes usar cuando analices perfiles de datos, consulta Cómo analizar perfiles de datos.

      Guardar los hallazgos de descubrimiento de muestra en BigQuery

      La Protección de datos sensibles puede agregar muestras de hallazgos a una tabla de BigQuery de tu elección. Los hallazgos de la muestra representan un subconjunto de todos los hallazgos y es posible que no representen todos los infoTypes que se descubrieron. Normalmente, el sistema genera alrededor de 10 muestras de hallazgos por conjunto de datos, pero esta cantidad puede variar para cada ejecución de descubrimiento.

      Cada hallazgo incluye la cadena real (también llamada cita) que se detectó y su ubicación exacta.

      Esta acción es útil si deseas evaluar si tu configuración de inspección coincide correctamente con el tipo de información que deseas marcar como sensible. Con los perfiles de datos exportados y los hallazgos de muestra exportados, puedes ejecutar consultas para obtener más información sobre los elementos específicos que se marcaron, los infoTypes con los que coincidieron, sus ubicaciones exactas, sus niveles de sensibilidad calculados y otros detalles.

      Para guardar los hallazgos de muestra en una tabla de BigQuery, sigue estos pasos:

      1. Activa Guardar los hallazgos de descubrimiento de muestra en BigQuery.

      2. Ingresa los detalles de la tabla de BigQuery en la que deseas guardar los hallazgos de muestra.

        La tabla que especifiques para esta acción debe ser diferente de la tabla que se usa para la acción Guardar copias de los perfiles de datos en BigQuery.

        • En ID del proyecto, ingresa el ID de un proyecto existente al que deseas exportar los hallazgos.

        • En ID de conjunto de datos, ingresa el nombre de un conjunto de datos existente en el proyecto.

        • En ID de tabla, ingresa el nombre de la tabla de BigQuery en la que deseas guardar los hallazgos. Si esta tabla no existe, Sensitive Data Protection la crea automáticamente con el nombre que proporcionas.

      Para obtener información sobre el contenido de cada hallazgo que se guarda en la tabla de BigQuery, consulta DataProfileFinding.

      Publicar en Pub/Sub

      Si activas la opción Publicar en Pub/Sub, podrás realizar acciones de forma programática según los resultados de la generación de perfiles. Puedes usar las notificaciones de Pub/Sub para desarrollar un flujo de trabajo que permita detectar y corregir los hallazgos con un riesgo o una sensibilidad de datos significativos.

      Para enviar notificaciones a un tema de Pub/Sub, sigue estos pasos:

      1. Activa Publicar en Pub/Sub.

        Aparecerá una lista de opciones. Cada opción describe un evento que hace que la Protección de datos sensibles envíe una notificación a Pub/Sub.

      2. Selecciona los eventos que deben activar una notificación de Pub/Sub.

        Si seleccionas Enviar una notificación de Pub/Sub cada vez que se actualiza un perfil, la Protección de datos sensibles enviará una notificación cuando haya un cambio en el nivel de sensibilidad, el nivel de riesgo de los datos, los infoTypes detectados, el acceso público y otras métricas importantes del perfil.

      3. Para cada evento que selecciones, sigue estos pasos:

        1. Ingresa el nombre del tema. El nombre debe tener el siguiente formato:

          projects/PROJECT_ID/topics/TOPIC_ID
          

          Reemplaza lo siguiente:

          • PROJECT_ID: Es el ID del proyecto asociado al tema de Pub/Sub.
          • TOPIC_ID: Es el ID del tema de Pub/Sub.
        2. Especifica si se debe incluir el perfil completo del conjunto de datos en la notificación o solo el nombre completo del recurso del conjunto de datos del que se generó el perfil.

        3. Establece los niveles mínimos de riesgo y sensibilidad de los datos que se deben cumplir para que Sensitive Data Protection envíe una notificación.

        4. Especifica si se debe cumplir solo una o ambas condiciones de riesgo y sensibilidad de los datos. Por ejemplo, si eliges AND, se deben cumplir las condiciones de riesgo de datos y de sensibilidad antes de que Sensitive Data Protection envíe una notificación.

      Enviar a Dataplex Universal Catalog como aspectos

      Esta acción te permite agregar aspectos de Dataplex Universal Catalog a los conjuntos de datos con perfil según las estadísticas de los perfiles de datos. Esta acción solo se aplica a los perfiles nuevos y actualizados. Los perfiles existentes que no se actualicen no se enviarán a Dataplex Universal Catalog.

      Cuando habilitas esta acción, la Protección de datos sensibles adjunta el aspecto Sensitive Data Protection profile a la entrada de Dataplex Universal Catalog para cada conjunto de datos nuevo o actualizado que generes como perfil. Los aspectos generados contienen estadísticas recopiladas de los perfiles de datos. Luego, puedes buscar en tu organización y en tus proyectos entradas con valores de aspecto Sensitive Data Protection profile específicos.

      Para enviar los perfiles de datos a Dataplex Universal Catalog, asegúrate de que la opción Enviar a Dataplex Catalog como aspectos esté activada.

      Para obtener más información, consulta Agrega aspectos de Dataplex Universal Catalog según las estadísticas de los perfiles de datos.

      Cómo establecer ubicaciones de procesamiento alternativas para imágenes

      En general, Protección de datos sensibles procesa tus datos en la ubicación donde se almacenan. Sin embargo, las imágenes solo se pueden procesar en una región múltiple o en la región global. Si estableces una ubicación alternativa, la Protección de datos sensibles la usará para procesar las imágenes que no estén en una multirregión o en la región global. Si omites esta sección, no se procesarán esas imágenes.

      Para establecer ubicaciones alternativas para el procesamiento de imágenes, selecciona una o ambas de las siguientes opciones:

      • Ubicación alternativa en la multirregión: Si una imagen no se puede procesar en su ubicación original, se procesará en la multirregión que corresponda a la ubicación original de la imagen. Si la ubicación original de la imagen no tiene una multirregión correspondiente, se omitirá la imagen.
      • Volver a la configuración global: Si una imagen no se puede procesar en su ubicación original, se procesará en la región global.

      Si seleccionas ambas opciones, Sensitive Data Protection elegirá qué ubicación usar como alternativa.

      Establece la ubicación en la que se almacenará la configuración

      Haz clic en la lista Ubicación del recurso y selecciona la región en la que deseas almacenar esta configuración de análisis. Todos los parámetros de configuración de análisis que crees más adelante también se almacenarán en esta ubicación.

      El lugar donde elijas almacenar la configuración del análisis no afecta los datos que se analizarán. Tus datos se analizan en la misma región en la que se almacenan. Para obtener más información, consulta Consideraciones sobre la residencia de los datos.

      Revisar y crear

      1. Si quieres asegurarte de que la generación de perfiles no comience automáticamente después de crear la configuración de análisis, selecciona Crear análisis en modo pausado.

        Esta opción es útil en los siguientes casos:

        • Elegiste guardar los perfiles de datos en BigQuery y quieres asegurarte de que el agente de servicio tenga acceso de escritura a la tabla de BigQuery en la que se guardarán las copias de los perfiles de datos.
        • Elegiste guardar los hallazgos de descubrimiento de muestra en BigQuery y quieres asegurarte de que el agente de servicio tenga acceso de escritura a la tabla de BigQuery en la que se guardarán los hallazgos de muestra.
        • Configuraste las notificaciones de Pub/Sub y deseas otorgar acceso de publicación al agente de servicio.
      2. Revisa tu configuración y haz clic en Crear.

        Sensitive Data Protection crea la configuración de análisis y la agrega a la lista de configuraciones de análisis de descubrimiento.

      Para ver o administrar tus opciones de configuración de análisis, consulta Administrar las opciones de configuración de análisis.

      ¿Qué sigue?

    12. Obtén más información para administrar perfiles de datos.
    13. Obtén más información para administrar las opciones de configuración de los análisis.
    14. Aprende a recibir y analizar los mensajes de Pub/Sub que publica el generador de perfiles de datos.
    15. Obtén más información para solucionar problemas con los perfiles de datos.