En esta página se describe el contenido de una tabla de detalles de transformación y se proporcionan consultas de ejemplo que puede ejecutar en ella.
Cuando desidentificas datos en el almacenamiento, puedes configurar la tarea de inspección para que proporcione detalles sobre cada transformación que realice. Protección de Datos Sensibles escribe estos detalles en una tabla de BigQuery que especifiques. En este documento, esa tabla se denomina tabla de detalles de la transformación.
Contenido de una tabla de detalles de transformación
En esta sección se enumeran y describen los contenidos de la tabla de detalles de la transformación.
nombre_recurso
Nombre del trabajo de inspección que ha completado la transformación.
container_name
El archivo que contiene los datos que se han transformado.
transformación
Detalles sobre la transformación. Este campo contiene las siguientes propiedades:
- tipo
El método de transformación que Protección de Datos Sensibles ha aplicado al resultado. Estos son algunos de los valores posibles:
- description
Representación de cadena de la transformación. El valor es el resultado de una llamada
toString()
en el mensaje de búfer de protocoloPrimitiveTransformation
para todos los tipos de transformaciones, excepto paraRecordSuppression
. Si el método de transformación es una supresión de registros, este campo está vacío.- condición
Representación de cadena del
RecordCondition
de la transformación. Este campo solo se define si se ha usado una condición de registro para determinar si Protección de Datos Sensibles debe aplicar la transformación. Ejemplos:(age_field <= 18)
(zip_field exists)
(zip_field == 01234) && (age_field <= 18) && (city_field exists)
- infoType
Detalles sobre el tipo de información detectada en el resultado. Este campo contiene las siguientes propiedades:
status_details
Detalles sobre el estado de la transformación. Si la transformación no se ha realizado correctamente, este campo especifica el motivo del error. Este campo contiene las siguientes propiedades:
- result_status_type
Código que representa el estado del intento de transformación. Estos son los valores posibles:
STATE_TYPE_UNSPECIFIED
: Protección de Datos Sensibles no ha podido determinar el estado de la transformación.INVALID_TRANSFORM
: Protección de Datos Sensibles no ha podido transformar el resultado.METADATA_UNRETRIEVABLE
: se ha detectado un problema en los metadatos personalizados de un archivo. Al escribir el archivo transformado, Protección de Datos Sensibles no ha podido recuperar los metadatos.SUCCESS
: la transformación se ha completado correctamente.
- detalles
Detalles adicionales sobre el estado. Este campo sigue las especificaciones definidas en
Status
. Este campo contiene las siguientes propiedades:- programación
- El código de error.
- mensaje
- El mensaje de error.
- detalles
- Una lista de mensajes que contienen los detalles del error.
transformed_bytes
Número de bytes que ha transformado Protección de Datos Sensibles. Si la transformación no se ha realizado correctamente o no había contenido que transformar, el valor es 0
.
transformation_location
Detalles sobre la ubicación de la transformación.
A continuación se muestra un ejemplo en JSON de una ubicación de transformación, donde Protección de Datos Sensibles ha realizado una transformación de infoType:
{
"finding_id": "2022-05-23T23:51:29.775337Z831678185946560283",
"record_transformation": null,
"container_type": "TRANSFORM_BODY"
}
A continuación, se muestra un ejemplo en JSON de una ubicación de transformación, donde Protección de Datos Sensibles ha realizado una transformación de registro:
{
"finding_id": null,
"record_transformation": {
"field_id": {
"name": " \"Name\""
},
"container_timestamp": {
"timestamp": null,
"seconds": "1654796423",
"nanos": "763000000"
},
"container_version": "1654796423733485"
},
"container_type": "TRANSFORM_TABLE"
}
}
Como se muestra en los ejemplos, Protección de Datos Sensibles rellena finding_id
o record_transformation
, según el tipo de transformación que haya realizado.
Los dos campos se excluyen mutuamente.
- finding_id
- Este campo se define si Protección de Datos Sensibles ha realizado una transformación de infotipo. Cada ID de resultado se corresponde con una entrada de la tabla de resultados. La tabla de resultados contiene todos los resultados que Protección de Datos Sensibles ha detectado durante la inspección. Esta tabla solo se crea si has configurado tu tarea de inspección para guardar los resultados en BigQuery.
- record_transformation
Este campo se define si Protección de Datos Sensibles ha realizado una transformación de registros en datos tabulares. Este campo contiene las siguientes propiedades:
- field_id
- La columna de la tabla que contiene el resultado.
- container_timestamp
- Marca de tiempo de modificación del archivo.
- container_version
- Número de generación del archivo que contiene el resultado.
- container_type
Información sobre la funcionalidad de los datos que contienen la detección. Estos son los valores posibles:
TRANSFORM_UNKNOWN_CONTAINER
: Protección de Datos Sensibles no ha podido determinar el tipo de datos que contiene el resultado.TRANSFORM_BODY
: Protección de Datos Sensibles ha detectado el hallazgo en el cuerpo de un archivo.TRANSFORM_METADATA
: Protección de Datos Sensibles ha detectado el resultado en los metadatos de un archivo.TRANSFORM_TABLE
: Protección de Datos Sensibles ha detectado el resultado en la tabla.
Consultas de ejemplo
A continuación, se muestran consultas de ejemplo que puedes ejecutar en la tabla de detalles de la transformación. Para obtener información sobre cómo consultar una tabla de BigQuery, consulta Ejecutar consultas interactivas.
Seleccionar todas las transformaciones fallidas
SELECT *
FROM `PROJECT_ID.DATASET_ID.TABLE_ID`
WHERE status_details.result_status_type != "SUCCESS";
Haz los cambios siguientes:
PROJECT_ID
: el ID del proyecto que contiene la tabla de detalles de la transformación.DATASET_ID
: el ID del conjunto de datos de BigQuery que contiene la tabla de detalles de la transformación.TABLE_ID
: el ID de la tabla de detalles de la transformación.
Cuenta el número de archivos que tienen errores de transformación
SELECT COUNT(DISTINCT(container_name))
FROM `PROJECT_ID.DATASET_ID.TABLE_ID`
WHERE status_details.result_status_type != "SUCCESS";
Selecciona todas las transformaciones que hayan usado el enmascaramiento de caracteres
SELECT resource_name, container_name, info_type.name
FROM `PROJECT_ID.DATASET_ID.TABLE_ID`,
UNNEST(transformation) AS tr
WHERE tr.type LIKE "CHARACTER_MASK";
Siguientes pasos
- Más información sobre el proceso de anonimización de datos almacenados
- Consulta cómo desidentificar datos almacenados mediante la Google Cloud consola.
- Consulta cómo desidentificar datos sensibles almacenados en Cloud Storage con la API DLP.
- Sigue los pasos del codelab Crear una copia desidentificada de los datos en Cloud Storage.
- Más información sobre las transformaciones de desidentificación