Referencia de detalles de la transformación

En esta página se describe el contenido de una tabla de detalles de transformación y se proporcionan consultas de ejemplo que puede ejecutar en ella.

Cuando desidentificas datos en el almacenamiento, puedes configurar la tarea de inspección para que proporcione detalles sobre cada transformación que realice. Protección de Datos Sensibles escribe estos detalles en una tabla de BigQuery que especifiques. En este documento, esa tabla se denomina tabla de detalles de la transformación.

Contenido de una tabla de detalles de transformación

En esta sección se enumeran y describen los contenidos de la tabla de detalles de la transformación.

nombre_recurso

Nombre del trabajo de inspección que ha completado la transformación.

container_name

El archivo que contiene los datos que se han transformado.

transformación

Detalles sobre la transformación. Este campo contiene las siguientes propiedades:

tipo

El método de transformación que Protección de Datos Sensibles ha aplicado al resultado. Estos son algunos de los valores posibles:

description

Representación de cadena de la transformación. El valor es el resultado de una llamada toString() en el mensaje de búfer de protocolo PrimitiveTransformation para todos los tipos de transformaciones, excepto para RecordSuppression. Si el método de transformación es una supresión de registros, este campo está vacío.

condición

Representación de cadena del RecordCondition de la transformación. Este campo solo se define si se ha usado una condición de registro para determinar si Protección de Datos Sensibles debe aplicar la transformación. Ejemplos:

  • (age_field <= 18)
  • (zip_field exists)
  • (zip_field == 01234) && (age_field <= 18) && (city_field exists)
infoType

Detalles sobre el tipo de información detectada en el resultado. Este campo contiene las siguientes propiedades:

name
Nombre del o infoType.
version
Versión de infoType.

status_details

Detalles sobre el estado de la transformación. Si la transformación no se ha realizado correctamente, este campo especifica el motivo del error. Este campo contiene las siguientes propiedades:

result_status_type

Código que representa el estado del intento de transformación. Estos son los valores posibles:

  • STATE_TYPE_UNSPECIFIED: Protección de Datos Sensibles no ha podido determinar el estado de la transformación.
  • INVALID_TRANSFORM: Protección de Datos Sensibles no ha podido transformar el resultado.
  • METADATA_UNRETRIEVABLE: se ha detectado un problema en los metadatos personalizados de un archivo. Al escribir el archivo transformado, Protección de Datos Sensibles no ha podido recuperar los metadatos.
  • SUCCESS: la transformación se ha completado correctamente.
detalles

Detalles adicionales sobre el estado. Este campo sigue las especificaciones definidas en Status. Este campo contiene las siguientes propiedades:

programación
El código de error.
mensaje
El mensaje de error.
detalles
Una lista de mensajes que contienen los detalles del error.

transformed_bytes

Número de bytes que ha transformado Protección de Datos Sensibles. Si la transformación no se ha realizado correctamente o no había contenido que transformar, el valor es 0.

transformation_location

Detalles sobre la ubicación de la transformación.

A continuación se muestra un ejemplo en JSON de una ubicación de transformación, donde Protección de Datos Sensibles ha realizado una transformación de infoType:

{
    "finding_id": "2022-05-23T23:51:29.775337Z831678185946560283",
    "record_transformation": null,
    "container_type": "TRANSFORM_BODY"
}

A continuación, se muestra un ejemplo en JSON de una ubicación de transformación, donde Protección de Datos Sensibles ha realizado una transformación de registro:

{
    "finding_id": null,
    "record_transformation": {
      "field_id": {
        "name": " \"Name\""
      },
      "container_timestamp": {
        "timestamp": null,
        "seconds": "1654796423",
        "nanos": "763000000"
      },
      "container_version": "1654796423733485"
    },
    "container_type": "TRANSFORM_TABLE"
  }
}

Como se muestra en los ejemplos, Protección de Datos Sensibles rellena finding_id o record_transformation, según el tipo de transformación que haya realizado. Los dos campos se excluyen mutuamente.

finding_id
Este campo se define si Protección de Datos Sensibles ha realizado una transformación de infotipo. Cada ID de resultado se corresponde con una entrada de la tabla de resultados. La tabla de resultados contiene todos los resultados que Protección de Datos Sensibles ha detectado durante la inspección. Esta tabla solo se crea si has configurado tu tarea de inspección para guardar los resultados en BigQuery.
record_transformation

Este campo se define si Protección de Datos Sensibles ha realizado una transformación de registros en datos tabulares. Este campo contiene las siguientes propiedades:

field_id
La columna de la tabla que contiene el resultado.
container_timestamp
Marca de tiempo de modificación del archivo.
container_version
Número de generación del archivo que contiene el resultado.
container_type

Información sobre la funcionalidad de los datos que contienen la detección. Estos son los valores posibles:

  • TRANSFORM_UNKNOWN_CONTAINER: Protección de Datos Sensibles no ha podido determinar el tipo de datos que contiene el resultado.
  • TRANSFORM_BODY: Protección de Datos Sensibles ha detectado el hallazgo en el cuerpo de un archivo.
  • TRANSFORM_METADATA: Protección de Datos Sensibles ha detectado el resultado en los metadatos de un archivo.
  • TRANSFORM_TABLE: Protección de Datos Sensibles ha detectado el resultado en la tabla.

Consultas de ejemplo

A continuación, se muestran consultas de ejemplo que puedes ejecutar en la tabla de detalles de la transformación. Para obtener información sobre cómo consultar una tabla de BigQuery, consulta Ejecutar consultas interactivas.

Seleccionar todas las transformaciones fallidas

SELECT *
    FROM `PROJECT_ID.DATASET_ID.TABLE_ID`
    WHERE status_details.result_status_type != "SUCCESS";

Haz los cambios siguientes:

  • PROJECT_ID: el ID del proyecto que contiene la tabla de detalles de la transformación.
  • DATASET_ID: el ID del conjunto de datos de BigQuery que contiene la tabla de detalles de la transformación.
  • TABLE_ID: el ID de la tabla de detalles de la transformación.

Cuenta el número de archivos que tienen errores de transformación

SELECT COUNT(DISTINCT(container_name))
    FROM `PROJECT_ID.DATASET_ID.TABLE_ID`
    WHERE status_details.result_status_type != "SUCCESS";

Selecciona todas las transformaciones que hayan usado el enmascaramiento de caracteres

SELECT resource_name, container_name, info_type.name
    FROM `PROJECT_ID.DATASET_ID.TABLE_ID`,
    UNNEST(transformation) AS tr
    WHERE tr.type LIKE "CHARACTER_MASK";

Siguientes pasos