Sensitive Data Protection tiene muchas capacidades potentes, pero según la cantidad de información que le indiques analizar, es posible que sus costos se eleven demasiado. En este tema, se describen varios métodos que puedes usar para mantener bajos los costos y, al mismo tiempo, asegurarte de que usas Sensitive Data Protection para analizar los datos exactos que pretendes analizar.
Inspección
Google recomienda las siguientes prácticas para ayudarte a controlar los costos de inspección.
Usa el muestreo para restringir el número de bytes inspeccionados
Si analizas tablas de BigQuery o buckets de Cloud Storage, la Protección de datos sensibles puede analizar un pequeño subconjunto del conjunto de datos. Esto puede proporcionar una muestra de resultados de análisis sin incurrir en los costos potenciales de analizar un conjunto de datos completo.
Una vez que encuentres una muestra con datos sensibles, puedes programar un segundo análisis más exhaustivo de ese conjunto de datos para descubrir la lista completa de hallazgos.
Para obtener más información, consulta Limita la cantidad de contenido inspeccionado en Inspecciona el almacenamiento y las bases de datos en busca de datos sensibles.
Analiza solo los datos que cambiaron
Puedes indicarle a la Protección de datos sensibles que evite analizar datos que no se modificaron desde la última inspección. Establecer un intervalo de tiempo te permite controlar qué datos analizar en función de cuándo se modificaron por última vez.
Si usas activadores de trabajo, puedes configurar la marca enable_auto_population_of_timespan_config
en TimespanConfig
para omitir de forma automática el contenido que se analizó durante el último trabajo programado.
Para obtener más información, consulta Limita el análisis solo al contenido nuevo en Crea y programa trabajos de inspección de Protección de datos sensibles.
Limita los análisis en Cloud Storage solo a archivos relevantes
Si especificas el mensaje CloudStorageRegexFileSet
, puedes usar filtros de expresión regular para controlar mejor qué archivos o carpetas en los depósitos incluir o excluir.
Esto es útil en situaciones en las que deseas omitir el análisis de archivos que sabes que no tienen datos sensibles, como copias de seguridad, archivos TMP, contenido web estático, etcétera.
Discovery
Te recomendamos las siguientes prácticas para ayudarte a controlar los costos de la generación de perfiles de datos.
Ejecuta una estimación
Antes de comenzar una operación de generación de perfiles de datos, considera ejecutar una estimación primero. Ejecutar una estimación te permite comprender el tamaño y la forma de los datos de BigQuery que se perfilarán. Cada estimación proporciona el recuento aproximado de tablas, el tamaño de los datos y el costo de la generación de perfiles. También se muestra una proyección del crecimiento mensual de tus datos de BigQuery.
Para obtener más información sobre cómo ejecutar una estimación, consulta lo siguiente:
- Calcular el costo de generar perfiles de datos en una organización o carpeta
- Calcular el costo de generar perfiles de datos para un solo proyecto
Agrega programas en la configuración de análisis
Para controlar el costo de la creación de perfiles de datos, considera crear una programación en la que establezcas filtros y condiciones. A continuación, se incluyen ejemplos de lo que puedes hacer:
- Si no necesitas generar perfiles de ciertas tablas, puedes especificar que las tablas que coincidan con tus filtros nunca se deben incluir en los perfiles.
- Si solo deseas generar el perfil de ciertas tablas, puedes desactivar la generación de perfiles para todas las tablas, excepto para las que coincidan con tu filtro.
- Si quieres que se genere el perfil de ciertas tablas solo una vez y nunca más, puedes especificar que nunca se vuelva a generar el perfil de esas tablas.
- Si no necesitas generar perfiles de tablas antiguas, puedes establecer una condición para generar perfiles solo de las tablas que se crearon después de una fecha determinada.
- Si no necesitas generar perfiles de las tablas nuevas, puedes establecer una condición para generar perfiles de las tablas solo cuando alcancen una cierta antigüedad o una cantidad mínima de filas.
Visualiza los costos con un panel y consulta tus registros de auditoría
Crea un panel para ver tus datos de facturación y poder realizar ajustes en tu uso de la Protección de datos sensibles. También considera transmitir tus registros de auditoría a Sensitive Data Protection para que puedas analizar los patrones de uso.
Puedes exportar tus datos de facturación a BigQuery y visualizarlos en una herramienta como Looker Studio. Para ver un instructivo sobre cómo crear un panel de facturación, consulta Visualiza Google Cloud la facturación con BigQuery y Looker Studio.
También puedes transmitir tus registros de auditoría a BigQuery y analizarlos en busca de patrones de uso, como los costos de consulta por usuario.
Configura alertas de presupuesto
Configura una alerta de presupuesto para hacer un seguimiento de cómo aumentan tus gastos hacia una cantidad determinada. Configurar un presupuesto no limita el uso de la API; solo te alerta cuando tu gasto se acerca al monto especificado.