Estima el costo de generar perfiles de datos de BigQuery en una organización o carpeta

En esta página, se describe cómo estimar el costo de generar perfiles de datos de BigQuery en una organización o carpeta. Si deseas crear una estimación para un proyecto, consulta Cómo calcular el costo de generar perfiles de datos para un solo proyecto.

Si deseas obtener más información sobre la generación de perfiles de datos de BigQuery, consulta Perfiles de datos para datos de BigQuery.

Descripción general

Antes de comenzar a generar perfiles de datos, puedes ejecutar una estimación para comprender la cantidad de datos de BigQuery que tienes y cuánto podría costar generar perfiles de esos datos. Para ejecutar una estimación, debes crear una.

Cuando creas una estimación, especificas el recurso (organización, carpeta o proyecto) que contiene los datos para los que deseas generar un perfil. Puedes establecer filtros para ajustar la selección de datos. También puedes establecer las condiciones que se deben cumplir antes de que Sensitive Data Protection genere el perfil de una tabla. La Protección de datos sensibles basa la estimación en la forma, el tamaño y el tipo de los datos en el momento en que creas la estimación.

Cada estimación incluye detalles como la cantidad de tablas coincidentes que se encontraron en el recurso, el tamaño total de todas esas tablas y el costo estimado de la generación de perfiles del recurso una vez y de forma mensual.

Para obtener más información sobre cómo se calculan los precios, consulta Precios de la generación de perfiles de datos.

Precios estimados

Crear una estimación no tiene costo.

Retención

Cada estimación se borra automáticamente después de 28 días.

Limitaciones

Si tu organización o carpeta tiene un proyecto protegido por un perímetro de servicio de los Controles del servicio de VPC, es posible que Protección de datos sensibles subestime la cantidad de datos de BigQuery en tu recurso. Si tienes perímetros de servicio, crea una estimación para cada uno de ellos de forma independiente.

Antes de comenzar

Para obtener los permisos que necesitas para crear y administrar estimaciones de costos de la generación de perfiles de datos, pídele a tu administrador que te otorgue el rol de IAM de administrador de DLP (roles/dlp.admin) en la organización o la carpeta. Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.

Cómo crear una estimación

  1. Ve a la página Crear estimación del perfil de datos.

    Ir a Crear estimación del perfil de datos

  2. Selecciona tu organización.

En las siguientes secciones, se proporciona más información sobre los pasos que se indican en la página Crear una estimación del perfil de datos. Al final de cada sección, haz clic en Continuar.

Selecciona un recurso para analizarlo

Realiza una de las siguientes acciones:

  • Para crear una estimación para una organización, selecciona Analizar toda la organización.
  • Para crear una estimación de una carpeta, selecciona Analizar la carpeta seleccionada. Luego, haz clic en Browse y selecciona la carpeta.

Filtros y condiciones de entrada

Puedes omitir esta sección si deseas incluir todas las tablas de BigQuery de la organización o la carpeta en tu estimación.

En esta sección, crearás filtros para especificar ciertos subconjuntos de tus datos que deseas incluir en la estimación o excluir de ella. Para los subconjuntos que incluyes en la estimación, también debes especificar las condiciones que debe cumplir una tabla del subconjunto para incluirse en la estimación.

Para establecer filtros y condiciones, sigue estos pasos:

  1. Haz clic en Agregar filtros y condiciones.
  2. En la sección Filtros, define uno o más filtros que especifiquen qué tablas se incluyen en el alcance de la estimación.

    Especifica al menos uno de los siguientes elementos:

    • Es un ID del proyecto o una expresión regular que especifica uno o más proyectos.
    • Es un ID de conjunto de datos o una expresión regular que especifica uno o más conjuntos de datos.
    • Es un ID de tabla o una expresión regular que especifica una o más tablas.

    Las expresiones regulares deben seguir la sintaxis RE2.

    Por ejemplo, si deseas que todas las tablas de un proyecto se incluyan en el filtro, especifica el ID de ese proyecto y deja los otros dos campos en blanco.

    Si quieres agregar más filtros, haz clic en Agregar filtro y repite este paso.

  3. Si los subconjuntos de datos definidos por tus filtros se deben excluir de la estimación, desactiva Incluir las tablas que coinciden en mi estimación. Si desactivas esta opción, se ocultarán las condiciones que se describen en el resto de esta sección.

  4. Opcional: En la sección Condiciones, especifica las condiciones que deben cumplir las tablas coincidentes para incluirse en la estimación. Si omites este paso, la Protección de datos sensibles incluirá todas las tablas compatibles que coincidan con tus filtros, independientemente de su tamaño y antigüedad.

    Configura las siguientes opciones:

    • Condiciones mínimas: Para excluir de la estimación las tablas pequeñas o nuevas, establece un recuento mínimo de filas o una antigüedad mínima de la tabla.

    • Condición de tiempo: Para excluir las tablas antiguas, activa la condición de tiempo. Luego, elige una fecha y hora. Cualquier tabla creada hasta esa fecha se excluye de la estimación.

      Por ejemplo, si configuras la condición de tiempo como 4/5/22, 11:59 p.m., la Protección de datos sensibles excluirá del cálculo cualquier tabla creada hasta el 4 de mayo de 2022 a las 11:59 p.m.

    • Tablas para generar el perfil: Para especificar los tipos de tablas que se incluirán en la estimación, selecciona Solo incluir las tablas de uno o más tipos especificados. Luego, selecciona los tipos de tablas que deseas incluir.

      Si no activas esta condición o no seleccionas ningún tipo de tabla, la Protección de datos sensibles incluirá todas las tablas admitidas en la estimación.

    Supongamos que tienes la siguiente configuración:

    • Condiciones mínimas

      • Cantidad mínima de filas: 10 filas
      • Duración mínima: 24 horas
    • Condición de tiempo

      • Marca de tiempo: 4/5/22, 11:59 p.m.
    • Tablas para generar perfiles

      La opción Solo incluir las tablas de uno o más tipos especificados está seleccionada. En la lista de tipos de tablas, solo se selecciona Tablas de BigLake de perfil.

    En este caso, Sensitive Data Protection excluye las tablas creadas hasta el 4 de mayo de 2022 a las 23:59 h. Entre las tablas creadas después de esta fecha y hora, la Protección de datos sensibles solo genera perfiles de las tablas de BigLake que tienen 10 filas o al menos 24 horas de antigüedad.

  5. Haz clic en Listo.

  6. Si deseas agregar más filtros y condiciones, haz clic en Agregar filtros y condiciones y repite los pasos anteriores.

    El último elemento de la lista de filtros y condiciones siempre es el que está etiquetado como Filtros y condiciones predeterminados. Este parámetro de configuración predeterminado se aplica a las tablas del recurso seleccionado (organización o carpeta) que no coinciden con ninguno de los filtros y las condiciones que creaste.

    Los filtros y las condiciones predeterminados
  7. Si quieres ajustar los filtros y las condiciones predeterminados, haz clic en Editar filtros y condiciones y ajusta la configuración según sea necesario.

Administra la facturación y el contenedor del agente de servicio

En esta sección, especificarás el proyecto que se usará como contenedor de agente de servicio. Puedes hacer que la Protección de datos sensibles cree automáticamente un proyecto nuevo o elegir uno existente.

Independientemente de si usas un agente de servicio recién creado o reutilizas uno existente, asegúrate de que tenga acceso de lectura a los datos para los que se creará el perfil.

Cómo crear un proyecto automáticamente

Si no tienes los permisos necesarios para crear un proyecto en la organización, debes seleccionar un proyecto existente o bien obtener los permisos necesarios. Para obtener información sobre los permisos necesarios, consulta Roles necesarios para trabajar con perfiles de datos a nivel de la organización o la carpeta.

Para crear automáticamente un proyecto que se usará como contenedor de agente de servicio, sigue estos pasos:

  1. En el campo Contenedor del agente de servicio, revisa el ID del proyecto sugerido y edítalo según sea necesario.
  2. Haz clic en Crear.
  3. Opcional: Actualiza el nombre predeterminado del proyecto.
  4. Selecciona la cuenta a la que se facturarán todas las operaciones facturables relacionadas con este proyecto nuevo, incluidas las que no se relacionan con el descubrimiento.

  5. Haz clic en Crear.

Sensitive Data Protection crea el proyecto nuevo. El agente de servicio de este proyecto se usará para la autenticación en Sensitive Data Protection y otras APIs.

Seleccionar un proyecto existente

Para seleccionar un proyecto existente como contenedor de agente de servicio, haz clic en el campo Contenedor de agente de servicio y selecciona el proyecto.

Establece la ubicación para almacenar la estimación

  1. En la lista Ubicación del recurso, selecciona la región en la que deseas almacenar esta estimación.

    El lugar donde elijas almacenar tu estimación no afecta los datos que se analizarán. Tampoco afecta la ubicación en la que se almacenan los perfiles de datos más adelante. Tus datos se analizan en la misma región en la que se almacenan (según se configuró en BigQuery). Para obtener más información, consulta Consideraciones sobre la residencia de los datos.

  2. Revisa tu configuración y haz clic en Crear.

Sensitive Data Protection crea la estimación y la agrega a la lista de estimaciones. Luego, ejecuta la estimación.

Según la cantidad de datos que haya en el recurso, una estimación puede tardar hasta 24 horas en completarse. Mientras tanto, puedes cerrar la página de Sensitive Data Protection y volver a revisarla más tarde. Aparecerá una notificación en la consola de Google Cloud cuando la estimación esté lista.

Cómo ver una estimación

  1. Ve a la lista de estimaciones.

    Ir a las estimaciones

  2. Haz clic en la estimación que deseas ver. La estimación contiene lo siguiente:

    • Es la cantidad de tablas en el recurso, menos las tablas que excluiste con filtros y condiciones.
    • Es la cantidad total de datos a la que equivalen las tablas.
    • Es la cantidad de unidades de suscripción necesarias para generar perfiles de esta cantidad de datos todos los meses.
    • El costo del descubrimiento inicial, que es el costo aproximado de la generación de perfiles de las tablas que se encontraron. Esta estimación se basa solo en una instantánea de los datos actuales y no tiene en cuenta cuánto crecen tus datos en un período determinado.
    • Estimaciones de costos adicionales para generar perfiles solo de las tablas que tienen menos de 6, 12 o 24 meses de antigüedad. Estas estimaciones adicionales se proporcionan para mostrarte cómo limitar aún más la cobertura de tus datos puede ayudarte a controlar el costo de la generación de perfiles de datos.
    • Es el costo mensual estimado de la creación de perfiles de tus datos, suponiendo que tu uso de BigQuery cada mes es el mismo que el de este mes.
    • Un gráfico que muestra el crecimiento de tu BigQuery a lo largo del tiempo.
    • Los detalles de configuración que estableciste

Gráfico de estimación

Cada estimación incluye un gráfico que muestra el crecimiento histórico de tus datos de BigQuery. Puedes usar esta información para estimar tu costo mensual de generación de perfiles de datos.

Gráfico que muestra el crecimiento de los datos de BigQuery

¿Qué sigue?