Mengelola pipeline

Dokumen ini menjelaskan cara mengelola pipeline BigQuery, termasuk cara menjadwalkan dan menghapus pipeline.

Dokumen ini juga menjelaskan cara melihat dan mengelola metadata pipeline di Dataplex.

Pipeline didukung oleh Dataform.

Sebelum memulai

  1. Membuat pipeline BigQuery.
  2. Untuk mengelola metadata pipeline di Dataplex, pastikan Dataplex API diaktifkan di project Google Cloud Anda.

Peran yang diperlukan

Untuk mendapatkan izin yang Anda perlukan untuk mengelola pipeline, minta administrator untuk memberi Anda peran IAM berikut:

  • Untuk menghapus pipeline: Dataform Admin (roles/dataform.Admin) di pipeline
  • Untuk melihat dan menjalankan pipeline: Dataform Viewer (roles/dataform.Viewer) di project

Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.

Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.

Untuk mengelola metadata pipeline di Dataplex, pastikan Anda memiliki peran Dataplex yang diperlukan

Untuk informasi selengkapnya tentang IAM Dataform, lihat Mengontrol akses dengan IAM.

Melihat semua pipeline

Untuk melihat daftar semua pipeline dalam project Anda, lakukan hal berikut:

  1. Di konsol Google Cloud, buka halaman BigQuery.

    Buka BigQuery

  2. Di panel Penjelajah, klik luaskan Pipeline.

Melihat operasi manual sebelumnya

Untuk melihat operasi manual sebelumnya dari pipeline yang dipilih, ikuti langkah-langkah berikut:

  1. Di konsol Google Cloud, buka halaman BigQuery.

    Buka BigQuery

  2. Di panel Explorer, luaskan project dan folder Pipelines, lalu pilih pipeline.

  3. Klik Executions.

  4. Opsional: Untuk memuat ulang daftar operasi sebelumnya, klik Muat ulang.

Mengonfigurasi pemberitahuan untuk operasi pipeline yang gagal

Setiap pipeline memiliki ID repositori Dataform yang sesuai. Setiap operasi pipeline BigQuery dicatat dalam log di Cloud Logging menggunakan ID repositori Dataform yang sesuai. Anda dapat menggunakan Cloud Monitoring untuk mengamati tren dalam log Cloud Logging untuk pengoperasian pipeline BigQuery dan untuk memberi tahu Anda saat kondisi yang Anda jelaskan terjadi.

Untuk menerima pemberitahuan saat pipeline BigQuery gagal dijalankan, Anda dapat membuat kebijakan pemberitahuan berbasis log untuk ID repositori Dataform yang sesuai. Untuk mengetahui petunjuknya, lihat Mengonfigurasi pemberitahuan untuk pemanggilan alur kerja yang gagal.

Untuk menemukan ID repositori Dataform pipeline Anda, lakukan hal berikut:

  1. Di konsol Google Cloud, buka halaman BigQuery.

    Buka BigQuery

  2. Di panel Explorer, luaskan project dan folder Pipelines, lalu pilih pipeline.

  3. Klik Setelan.

    ID repositori Dataform pipeline Anda ditampilkan di bagian bawah tab Setelan.

Menghapus pipeline

Untuk menghapus pipeline secara permanen, ikuti langkah-langkah berikut:

  1. Di konsol Google Cloud, buka halaman BigQuery.

    Buka BigQuery

  2. Di panel Explorer, luaskan project Anda dan folder Pipelines. Temukan pipeline yang ingin Anda hapus.

  3. Klik Lihat tindakan di samping pipeline, lalu klik Hapus.

  4. Klik Hapus.

Mengelola metadata di Dataplex

Dataplex memungkinkan Anda menyimpan dan mengelola metadata untuk pipeline. Pipeline tersedia di Dataplex secara default, tanpa konfigurasi tambahan.

Anda dapat menggunakan Dataplex untuk mengelola pipeline di semua lokasi pipeline. Pengelolaan pipeline di Dataplex tunduk pada kuota dan batas Dataplex serta harga Dataplex.

Dataplex otomatis mengambil metadata berikut dari pipeline:

  • Nama aset data
  • Induk aset data
  • Lokasi aset data
  • Jenis aset data
  • Project Google Cloud yang sesuai

Dataplex mencatat pipeline sebagai entri dengan nilai entri berikut:

Grup entri sistem
Grup entri sistem untuk pipeline adalah @dataform. Untuk melihat detail entri pipeline di Dataplex, Anda perlu melihat grup entri sistem dataform. Untuk mengetahui petunjuk tentang cara melihat daftar semua entri dalam grup entri, lihat Melihat detail grup entri dalam dokumentasi Dataplex.
Jenis entri sistem
Jenis entri sistem untuk pipeline adalah dataform-code-asset. Untuk melihat detail pipeline,Anda perlu melihat jenis entri sistem dataform-code-asset, memfilter hasil dengan filter berbasis aspek, dan menetapkan kolom type di dalam aspek dataform-code-asset ke WORKFLOW. Kemudian, pilih entri pipeline yang dipilih. Untuk petunjuk tentang cara melihat detail jenis entri yang dipilih, lihat Melihat detail jenis entri dalam dokumentasi Dataplex. Untuk petunjuk tentang cara melihat detail entri yang dipilih, lihat Melihat detail entri dalam dokumentasi Dataplex.
Jenis aspek sistem
Jenis aspek sistem untuk pipeline adalah dataform-code-asset. Untuk memberikan konteks tambahan ke pipeline di Dataplex dengan menganotasi entri pipeline data dengan aspek, lihat jenis aspek dataform-code-asset, filter hasil dengan filter berbasis aspek, dan setel kolom type di dalam aspek dataform-code-asset ke WORKFLOW. Untuk petunjuk tentang cara menganotasi entri dengan aspek, lihat Mengelola aspek dan memperkaya metadata dalam dokumentasi Dataplex.
Jenis
Jenis untuk kanvas data adalah WORKFLOW. Jenis ini memungkinkan Anda memfilter pipeline dalam jenis entri sistem dataform-code-asset dan jenis aspek dataform-code-asset menggunakan kueri aspect:dataplex-types.global.dataform-code-asset.type=WORKFLOW dalam filter berbasis aspek.

Untuk petunjuk tentang cara menelusuri aset di Dataplex, lihat Menelusuri aset data di Dataplex dalam dokumentasi Dataplex.

Langkah berikutnya