Memecahkan masalah silsilah data

Dokumen ini menjelaskan cara menyelesaikan masalah terkait silsilah data Katalog Universal Dataplex.

Jenis project

Aset data dapat berada di project yang berbeda. Berikut adalah ringkasan kemungkinan project dan nama asetnya.

Project penyimpanan BigQuery

Project ini menyimpan aset data BigQuery Anda. Anda dapat menemukannya di detail aset sebagai bagian dari Table ID, sebelum titik pertama.

Di UI BigQuery, nama project penyimpanan ditampilkan di
    kolom ID Tabel, sebelum titik pertama dalam nama tabel yang sepenuhnya memenuhi syarat.
Gambar 1. Nama project penyimpanan BigQuery.

Project Compute

Project ini menyimpan metadata silsilah data. Untuk BigQuery, di sinilah Anda menjalankan tugas. Jika menjalankan tugas menggunakan konsol Google Cloud , Anda dapat menemukan nama project komputasi di pemilih project:

UI BigQuery menampilkan project komputasi bernama docs-compute di halaman tempat Anda menjalankan kueri SQL.
Gambar 2. Nama project komputasi yang menjalankan tugas BigQuery.

Saat mengirim permintaan ke BigQuery API, tentukan project komputasi di URL, misalnya:

POST /bigquery/v2/projects/docs-compute/jobs HTTP/1.1
Host: bigquery.googleapis.com
User-Agent: Go-http-client/1.1
Authorization: <REDACTED 1031 BYTES>
Accept-Encoding: gzip
{
  "configuration": {
    "query": {
      "useLegacySql": false,
      "query": "CREATE OR REPLACE TABLE `docs-target.dataset.target-002` AS SELECT * FROM `docs-source.dataset.source-002`;"
    }
  },
  "jobReference": {
    "projectId": "docs-compute",
    "jobId": "docs-compute-job-id",
    "location": "us",
  }
}

Project aktif

Ini adalah project tempat Anda melihat silsilah data. Konsol Google Cloud menampilkan project aktif di pemilih project. Jika Anda menggunakan API, project aktif adalah project tempat Anda melakukan panggilan API.

UI BigQuery menampilkan silsilah data untuk
    set data bernama source-001, yang ada dalam project bernama docs-source.
Gambar 3. Project aktif di konsol Google Cloud .

Silsilah data BigQuery tidak ditampilkan

Masalah berikut terjadi setelah menjalankan tugas BigQuery. Dalam hal ini, masalah dapat disebabkan oleh tiga skenario:

Jika Anda melihat pesan "Pengambilan silsilah gagal karena izin tidak ada" di bagian bawah halaman, Anda tidak memiliki izin di project aktif. Jika tidak, Anda tidak memiliki izin di project compute.

Grafik silsilah kosong.
Gambar 4. Contoh silsilah yang tidak ditampilkan di UI BigQuery.

Untuk mengatasi masalah ini, periksa apakah Data Lineage API diaktifkan untuk project compute. Setelah mengaktifkan API, Anda harus menjalankan tugas untuk melihat asal data. Bergantung pada volume dan kompleksitas data yang diproses, silsilah data dapat ditampilkan dalam waktu 30 menit hingga 24 jam.

Selanjutnya, periksa apakah Data Lineage API diaktifkan untuk project aktif.

Jika Data Lineage API diaktifkan, berikan peran Pelihat Silsilah Data (roles/datalineage.viewer) di project aktif dan komputasi.

Metadata proses BigQuery tidak ditampilkan

Masalah berikut terjadi saat Anda membuka panel detail tabel, yang tidak menampilkan semua detail seperti pernyataan SQL atau properti Process type. Hal ini terjadi meskipun asal data ditampilkan dengan benar.

Hal ini dapat terjadi jika Anda tidak memiliki izin untuk melihat metadata di project compute.

Contoh:

  • Tabel sumber BigQuery: docs-source.dataset.source-001
  • Tabel target BigQuery: docs-target.dataset.target-001
  • Silsilah data antara docs-source.dataset.source-001 dan docs-target.dataset.target-001 di project komputasi docs-compute
  • Anda memiliki peran Pelihat Silsilah Data untuk project aktif dan compute docs-compute.

Mengklik detail proses BigQuery akan menampilkan pesan berikut di konsol Google Cloud :

You don't have permission to view BigQuery process metadata in project X.
Di UI BigQuery, pada tab Silsilah, panel Detail menampilkan
    pesan error.
Gambar 5. Contoh detail proses BigQuery tidak ditampilkan di UI BigQuery.

Untuk mengatasi masalah ini, beri pengguna izin bigquery.jobs.get (misalnya, disertakan dalam peran BigQuery Resource Viewer) di project komputasi.

Detail tabel BigQuery tidak ditampilkan

Masalah berikut terjadi saat Anda membuka panel detail tabel, yang hanya menampilkan properti Fully qualified name. Hal ini terjadi meskipun asal-usul data ditampilkan dengan benar. Hal ini dapat terjadi jika Anda tidak memiliki semua izin yang diperlukan di project penyimpanan tabel.

Contoh:

  • Tabel BigQuery docs-source.dataset.source-001
  • Tabel BigQuery docs-target.dataset.target-001
  • Silsilah data antara docs-source.dataset.source-001 dan docs-target.dataset.target-001 dengan project komputasi docs-compute
  • Anda memiliki peran Pelihat Silsilah Data untuk project aktif dan komputasi docs-compute

Dalam hal ini, saat Anda mengklik detail node BigQuery, Anda dapat melihat pesan Entry with this fully qualified name is not available in Dataplex Universal Catalog or you do not have permissions to view it.

Detail tabel BigQuery tidak ditampilkan.
Gambar 6. Contoh detail tabel BigQuery tidak ditampilkan di UI BigQuery.

Untuk mengatasi masalah ini, berikan izin bigquery.tables.get (misalnya, yang termasuk dalam peran BigQuery Data Viewer) di project penyimpanan.