En esta página, se muestra cómo resolver problemas de Data Catalog y el linaje de datos.
Tipos de proyecto
Como los recursos de datos pueden residir en diferentes proyectos, aquí tienes un resumen de las posibles proyectos y sus nombres de recursos.
Proyecto de almacenamiento de BigQuery
Este proyecto almacena tus recursos de datos de BigQuery.
Puedes encontrarlo en los detalles del activo como parte de Table ID
, antes del primer punto.
Proyecto de Compute
Este proyecto almacena los metadatos del linaje de datos. En BigQuery, aquí es donde ejecutas un trabajo. Si ejecutas un trabajo desde la IU, puedes encontrar el nombre del proyecto de procesamiento en el selector de proyectos:
Cuando envíes solicitudes a la API de BigQuery, especifica el proyecto de procesamiento en la URL, por ejemplo:
POST /bigquery/v2/projects/docs-compute/jobs HTTP/1.1
Host: bigquery.googleapis.com
User-Agent: Go-http-client/1.1
Authorization: <REDACTED 1031 BYTES>
Accept-Encoding: gzip
{
"configuration": {
"query": {
"useLegacySql": false,
"query": "CREATE OR REPLACE TABLE `docs-target.dataset.target-002` AS SELECT * FROM `docs-source.dataset.source-002`;"
}
},
"jobReference": {
"projectId": "docs-compute",
"jobId": "docs-compute-job-id",
"location": "us",
}
}
Proyecto activo
Este es el proyecto desde el que estás viendo el linaje de datos. La consola de Google Cloud muestra el proyecto activo en el selector de proyectos. Si usas la API, el proyecto activo es el proyecto desde el que realizas realizar llamadas a la API.
No se muestra el linaje de datos de BigQuery
El siguiente problema ocurre después de ejecutar un trabajo de BigQuery. En este caso, el problema puede deberse a tres situaciones:
- La API de Data Lineage está inhabilitada en el proyecto activo o el proyecto de procesamiento.
- No tienes el visualizador de linaje de datos (
roles/datalineage.viewer
) en el proyecto activo o de procesamiento. - El linaje de datos aún no llegó. Según el volumen y la complejidad de los datos que se procesan, puede tardar desde 30 minutos estándar hasta 24 horas para mostrar el linaje de datos.
Si ves el mensaje "No se pudo recuperar el linaje porque faltan permisos" en la parte inferior de la página, significa que te faltan permisos en el proyecto activo. De lo contrario, te faltan permisos proyecto de procesamiento.
Para resolver este problema, primero verifica si la API de Data Lineage está habilitada para el proyecto de procesamiento. Después de habilitar la API, tienes que ejecutar un trabajo para ver el linaje de datos. Según el volumen y la complejidad de los datos que se procesan, puede demorar desde 30 minutos estándar hasta 24 horas para que se muestre el linaje de datos.
A continuación, verifica si la API de Data Lineage está habilitada para el proyecto activo. Después de habilitar la API, si tienes los permisos necesarios (consulta a continuación), verás el linaje.
Cuando se habilitó la API de Data Lineage, otorga
Visualizador de linaje de datos (roles/datalineage.viewer
)
tanto en los períodos activos
y el proyecto de procesamiento.
No se muestran los metadatos del proceso de BigQuery
Descripción del problema
El siguiente problema ocurre cuando abres el panel de detalles de la tabla, que no
muestra todos los detalles, como la instrucción de SQL o la propiedad Process type
.
Esto sucede a pesar de que el linaje de datos se muestra correctamente.
Esto puede ocurrir cuando no tienes permisos para ver metadatos en el proyecto de procesamiento.
Ejemplo:
- Tabla de origen de BigQuery:
docs-source.dataset.source-001
- Tabla de destino de BigQuery:
docs-target.dataset.target-001
- Linaje de datos entre
docs-source.dataset.source-001
ydocs-target.dataset.target-001
en proyecto de procesamientodocs-compute
- Tienes el Visualizador de linaje de datos.
rol para activo
y procesar los proyectos
docs-compute
.
Cuando haces clic en los detalles del proceso de BigQuery, se muestra el siguiente mensaje:
You don't have permission to view BigQuery process metadata in project X.
En la consola de Google Cloud:
Para resolver este problema, otorga al usuario el permiso bigquery.jobs.get
(por ejemplo, se incluye en Visualizador de recursos de BigQuery
en el proyecto de procesamiento.
No se muestran los detalles de la tabla de BigQuery
El siguiente problema ocurre cuando abres el panel de detalles de la tabla, que muestra solo el "Nombre completamente calificado" propiedad. Esto sucede a pesar de que el linaje de datos se muestre correctamente. Esto puede suceder cuando no tienes todos los permisos necesarios en la columna proyectos de almacenamiento.
Ejemplo:
- Tabla de BigQuery
docs-source.dataset.source-001
, - Tabla de BigQuery
docs-target.dataset.target-001
, - linaje de datos entre
docs-source.dataset.source-001
ydocs-target.dataset.target-001
con el proyecto de procesamientodocs-compute
- Usuarios que tengan la función de Visualizador de linaje de datos
para el rol activo
y procesar los proyectos
docs-compute
.
En este caso, el usuario, al hacer clic en los detalles del nodo de BigQuery, puede ver un mensaje
Entry with this fully qualified name is not available in the Data Catalog
Para resolver este problema, otorga al usuario permisos bigquery.tables.get
(por ejemplo, se incluye en Visualizador de datos de BigQuery
en el proyecto de almacenamiento.