Mengelola pipeline
Dokumen ini menjelaskan cara mengelola pipeline BigQuery, termasuk cara menjadwalkan dan menghapus pipeline.
Dokumen ini juga menjelaskan cara melihat dan mengelola metadata pipeline di Dataplex.
Pipeline didukung oleh Dataform.
Sebelum memulai
- Membuat pipeline BigQuery.
- Untuk mengelola metadata pipeline di Dataplex, pastikan Dataplex API diaktifkan di project Google Cloud Anda.
Peran yang diperlukan
Untuk mendapatkan izin yang Anda perlukan untuk mengelola pipeline, minta administrator untuk memberi Anda peran IAM berikut:
-
Untuk menghapus pipeline:
Dataform Admin (
roles/dataform.Admin
) di pipeline -
Untuk melihat dan menjalankan pipeline:
Dataform Viewer (
roles/dataform.Viewer
) di project
Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.
Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.
Untuk mengelola metadata pipeline di Dataplex, pastikan Anda memiliki peran Dataplex yang diperlukan
Untuk informasi selengkapnya tentang IAM Dataform, lihat Mengontrol akses dengan IAM.
Melihat semua pipeline
Untuk melihat daftar semua pipeline dalam project Anda, lakukan hal berikut:
Di konsol Google Cloud, buka halaman BigQuery.
Di panel Penjelajah, klik
luaskan Pipeline.
Melihat operasi manual sebelumnya
Untuk melihat operasi manual sebelumnya dari pipeline yang dipilih, ikuti langkah-langkah berikut:
Di konsol Google Cloud, buka halaman BigQuery.
Di panel Explorer, luaskan project dan folder Pipelines, lalu pilih pipeline.
Klik Executions.
Opsional: Untuk memuat ulang daftar operasi sebelumnya, klik Muat ulang.
Mengonfigurasi pemberitahuan untuk operasi pipeline yang gagal
Setiap pipeline memiliki ID repositori Dataform yang sesuai. Setiap operasi pipeline BigQuery dicatat dalam log di Cloud Logging menggunakan ID repositori Dataform yang sesuai. Anda dapat menggunakan Cloud Monitoring untuk mengamati tren dalam log Cloud Logging untuk pengoperasian pipeline BigQuery dan untuk memberi tahu Anda saat kondisi yang Anda jelaskan terjadi.
Untuk menerima pemberitahuan saat pipeline BigQuery gagal dijalankan, Anda dapat membuat kebijakan pemberitahuan berbasis log untuk ID repositori Dataform yang sesuai. Untuk mengetahui petunjuknya, lihat Mengonfigurasi pemberitahuan untuk pemanggilan alur kerja yang gagal.
Untuk menemukan ID repositori Dataform pipeline Anda, lakukan hal berikut:
Di konsol Google Cloud, buka halaman BigQuery.
Di panel Explorer, luaskan project dan folder Pipelines, lalu pilih pipeline.
Klik Setelan.
ID repositori Dataform pipeline Anda ditampilkan di bagian bawah tab Setelan.
Menghapus pipeline
Untuk menghapus pipeline secara permanen, ikuti langkah-langkah berikut:
Di konsol Google Cloud, buka halaman BigQuery.
Di panel Explorer, luaskan project Anda dan folder Pipelines. Temukan pipeline yang ingin Anda hapus.
Klik
Lihat tindakan di samping pipeline, lalu klik Hapus.Klik Hapus.
Mengelola metadata di Dataplex
Dataplex memungkinkan Anda menyimpan dan mengelola metadata untuk pipeline. Pipeline tersedia di Dataplex secara default, tanpa konfigurasi tambahan.
Anda dapat menggunakan Dataplex untuk mengelola pipeline di semua lokasi pipeline. Pengelolaan pipeline di Dataplex tunduk pada kuota dan batas Dataplex serta harga Dataplex.
Dataplex otomatis mengambil metadata berikut dari pipeline:
- Nama aset data
- Induk aset data
- Lokasi aset data
- Jenis aset data
- Project Google Cloud yang sesuai
Dataplex mencatat pipeline sebagai entri dengan nilai entri berikut:
- Grup entri sistem
- Grup entri sistem
untuk pipeline adalah
@dataform
. Untuk melihat detail entri pipeline di Dataplex, Anda perlu melihat grup entri sistemdataform
. Untuk mengetahui petunjuk tentang cara melihat daftar semua entri dalam grup entri, lihat Melihat detail grup entri dalam dokumentasi Dataplex. - Jenis entri sistem
- Jenis entri sistem
untuk pipeline adalah
dataform-code-asset
. Untuk melihat detail pipeline,Anda perlu melihat jenis entri sistemdataform-code-asset
, memfilter hasil dengan filter berbasis aspek, dan menetapkan kolomtype
di dalam aspekdataform-code-asset
keWORKFLOW
. Kemudian, pilih entri pipeline yang dipilih. Untuk petunjuk tentang cara melihat detail jenis entri yang dipilih, lihat Melihat detail jenis entri dalam dokumentasi Dataplex. Untuk petunjuk tentang cara melihat detail entri yang dipilih, lihat Melihat detail entri dalam dokumentasi Dataplex. - Jenis aspek sistem
- Jenis aspek sistem
untuk pipeline adalah
dataform-code-asset
. Untuk memberikan konteks tambahan ke pipeline di Dataplex dengan menganotasi entri pipeline data dengan aspek, lihat jenis aspekdataform-code-asset
, filter hasil dengan filter berbasis aspek, dan setel kolomtype
di dalam aspekdataform-code-asset
keWORKFLOW
. Untuk petunjuk tentang cara menganotasi entri dengan aspek, lihat Mengelola aspek dan memperkaya metadata dalam dokumentasi Dataplex. - Jenis
- Jenis untuk kanvas data adalah
WORKFLOW
. Jenis ini memungkinkan Anda memfilter pipeline dalam jenis entri sistemdataform-code-asset
dan jenis aspekdataform-code-asset
menggunakan kueriaspect:dataplex-types.global.dataform-code-asset.type=WORKFLOW
dalam filter berbasis aspek.
Untuk petunjuk tentang cara menelusuri aset di Dataplex, lihat Menelusuri aset data di Dataplex dalam dokumentasi Dataplex.
Langkah berikutnya
- Pelajari pipeline BigQuery lebih lanjut.
- Pelajari cara membuat pipeline.
- Pelajari cara menjadwalkan pipeline.