Sensitive Data Protection tiene muchas capacidades potentes, pero según la cantidad de información que le indiques analizar, es posible que sus costos se eleven demasiado. En este tema, se describen varios métodos que puedes usar a fin de mantener bajos los costos y al mismo tiempo asegurarte de que uses Sensitive Data Protection para analizar los datos exactos que pretendes analizar.
Inspección
Google recomienda las siguientes prácticas para ayudarte a controlar los costos de inspección.
Usa el muestreo para restringir el número de bytes inspeccionados
Si analizas tablas de BigQuery o buckets de Cloud Storage, la Protección de datos sensibles puede analizar un pequeño subconjunto del conjunto de datos. Esto puede proporcionar una muestra de resultados de análisis sin incurrir en los costos potenciales de analizar un conjunto de datos completo.
Una vez que encuentres una muestra con datos sensibles, puedes programar un segundo análisis más exhaustivo de ese conjunto de datos para descubrir la lista completa de hallazgos.
Para obtener más información, consulta Limita la cantidad de contenido inspeccionado en Inspecciona el almacenamiento y las bases de datos en busca de datos sensibles.
Analiza solo los datos que cambiaron
Puedes indicar a la Protección de datos sensibles que evite analizar datos que no se modificaron desde la última inspección. Establecer un intervalo de tiempo te permite controlar qué datos analizar en función de cuándo se modificaron por última vez.
Si usas activadores de trabajo, puedes configurar la marca enable_auto_population_of_timespan_config
en TimespanConfig
para omitir de forma automática el contenido que se analizó durante el último trabajo programado.
Para obtener más información, consulta Limita el análisis solo al contenido nuevo en Crea y programa trabajos de inspección de Protección de datos sensibles.
Limita los análisis en Cloud Storage solo a archivos relevantes
Si especificas el mensaje CloudStorageRegexFileSet
, puedes usar filtros de expresión regular para controlar mejor qué archivos o carpetas en los depósitos incluir o excluir.
Esto es útil en situaciones en las que deseas omitir el análisis de archivos que sabes que no tienen datos sensibles, como copias de seguridad, archivos TMP, contenido web estático, etcétera.
Discovery
Te recomendamos que sigas las siguientes prácticas para controlar los costos de creación de perfiles de datos.
Ejecuta una estimación
Antes de comenzar una operación de perfilado de datos, considera ejecutar una estimación primero. Ejecutar una estimación te permite comprender el tamaño y la forma de los datos de BigQuery que se perfilarán. Cada estimación proporciona el recuento aproximado de tablas, el tamaño de los datos y el costo de generación de perfiles. También muestra una proyección del crecimiento mensual de tus datos de BigQuery.
Para obtener más información sobre cómo ejecutar una estimación, consulta lo siguiente:
- Calcular el costo de generar perfiles de datos en una organización o carpeta
- Calcular el costo de generar perfiles de datos para un solo proyecto
Agrega programas a tus configuraciones de análisis
Para ayudar a controlar el costo de la generación de perfiles de datos, considera crear una programación en la que establezcas filtros y condiciones. Los siguientes son ejemplos de lo que puedes hacer:
- Si no necesitas generar perfiles de ciertas tablas, puedes especificar que las tablas que coincidan con tus filtros nunca deben generar perfiles.
- Si quieres generar perfiles solo de ciertas tablas, puedes desactivar la generación de perfiles para todas las tablas, excepto para aquellas que coincidan con tu filtro.
- Si deseas que se genere el perfil de ciertas tablas solo una vez y nunca más, puedes especificar que esas tablas nunca deben volver a generar el perfil.
- Si no necesitas generar perfiles de tablas antiguas, puedes establecer una condición para generar perfiles solo de las tablas que se crearon después de una fecha determinada.
- Si no necesitas generar perfiles de tablas nuevas, puedes establecer una condición para generar perfiles de tablas solo cuando alcancen una antigüedad determinada o un recuento mínimo de filas.
Visualiza los costos con un panel y consulta tus registros de auditoría
Crea un panel para ver tus datos de facturación de forma que puedas realizar ajustes en tu uso de la Protección de datos sensibles. También considera transmitir tus registros de auditoría a Sensitive Data Protection para que puedas analizar los patrones de uso.
Puedes exportar tus datos de facturación a BigQuery y visualizarlos en una herramienta como Looker Studio. Para ver un instructivo sobre cómo crear un panel de facturación, consulta Visualiza la Facturación de Google Cloud mediante BigQuery y Looker Studio.
También puedes transmitir tus registros de auditoría a BigQuery y analizarlos en busca de patrones de uso, como los costos de consulta por usuario.
Configura alertas de presupuesto
Configura una alerta de presupuesto para hacer un seguimiento de cómo aumentan tus gastos hacia una cantidad determinada. Configurar un presupuesto no limita el uso de la API; solo te alerta cuando tu gasto se acerca al monto especificado.