Dokumen ini menunjukkan cara melakukan hal berikut:
- Menentukan pernyataan SQL yang akan dijalankan sebelum pembuatan tabel.
- Menentukan pernyataan SQL yang akan dijalankan setelah pembuatan tabel.
- Nonaktifkan pembuatan tabel.
- Tambahkan tag eksekusi.
Sebelum memulai
Di Google Cloud console, buka halaman Dataform.
Pilih atau buat repositori.
Pilih atau buat ruang kerja pengembangan.
Tentukan file SQLX dari salah satu jenis berikut:
Peran yang diperlukan
Untuk mendapatkan izin yang
Anda perlukan untuk menyelesaikan tugas dalam dokumen ini,
minta administrator untuk memberi Anda
Dataform Editor (roles/dataform.editor
)
peran IAM di ruang kerja.
Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.
Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.
Menentukan pernyataan SQL yang akan dieksekusi sebelum pembuatan tabel
Anda dapat mengonfigurasi Dataform untuk menjalankan satu atau beberapa pernyataan SQL
sebelum membuat tabel yang dipilih di BigQuery. Untuk mengeksekusi pernyataan SQL
sebelum Dataform membuat tabel yang dipilih, tambahkan pernyataan
Anda ke blok pre_operations
dalam file SQLX definisi tabel.
Untuk membuat pernyataan SQL kustom yang dieksekusi sebelum Dataform membuat tabel tertentu, ikuti langkah-langkah berikut:
- Buka ruang kerja pengembangan Anda.
- Di panel Files, luaskan
definitions/
. - Buka file definisi tabel SQLX.
- Di luar blok
config
, masukkanpre_operations { ... }
. - Di dalam
pre_operations { ... }
, tambahkan pernyataan SQL Anda. - Opsional: Untuk menambahkan beberapa pernyataan, pisahkan dengan
---
. - Opsional: Klik Format.
Contoh kode berikut menunjukkan pernyataan pre_operations
yang membuat
fungsi sementara yang dapat digunakan dalam pernyataan pilih:
pre_operations {
CREATE TEMP FUNCTION AddFourAndDivide(x INT64, y INT64)
RETURNS FLOAT64
AS ((x + 4) / y);
}
Menentukan pernyataan SQL yang akan dieksekusi setelah pembuatan tabel
Anda dapat mengonfigurasi Dataform untuk menjalankan satu atau beberapa pernyataan SQL setelah membuat tabel yang dipilih di BigQuery. Untuk mengeksekusi pernyataan SQL
setelah Dataform membuat tabel yang dipilih, tambahkan pernyataan Anda ke
blok post_operations
dalam file SQLX definisi tabel. Anda dapat menambahkan
beberapa pernyataan SQL ke blok post_operations
.
Untuk membuat pernyataan SQL kustom yang dijalankan setelah Dataform membuat tabel tertentu, ikuti langkah-langkah berikut:
- Buka ruang kerja pengembangan Anda.
- Di panel Files, luaskan
definitions/
. - Buka file definisi tabel SQLX.
- Di luar blok
config
, masukkanpost_operations { ... }
. - Di dalam
post_operations { ... }
, tambahkan pernyataan SQL Anda. - Opsional: Klik Format.
Contoh kode berikut menunjukkan pernyataan post_operations
yang memberikan akses grup
ke tabel yang dibuat:
post_operations {
GRANT `roles/bigquery.dataViewer`
ON
TABLE ${self()}
TO "group:allusers@example.com", "user:otheruser@example.com"
}
Menonaktifkan pembuatan tabel
Untuk menghentikan Dataform membuat tabel yang dipilih di BigQuery, Anda dapat menonaktifkan tabel dalam file definisi tabel SQLX-nya. Dataform menyimpan tabel yang dinonaktifkan dalam grafik dependensi, tetapi tidak mengompilasi dan membuatnya. Hal ini dapat berguna, misalnya, jika tabel gagal dan Anda tidak ingin seluruh alur kerja gagal saat Anda memperbaiki masalah.
Untuk menonaktifkan tabel, ikuti langkah-langkah berikut:
- Buka ruang kerja pengembangan Anda.
- Di panel Files, luaskan
definitions/
. - Pilih file definisi tabel SQLX.
- Di blok
config
file, masukkandisabled: true
. - Opsional: Klik Format.
Contoh kode berikut menunjukkan tabel yang dinonaktifkan:
config {
type: "table",
disabled: true
}
select * from ${ref("source_data")}
Menambahkan tag eksekusi
Bagian ini menunjukkan cara menambahkan tag ke file SQLX inti Dataform untuk mengategorikan alur kerja Anda.
Untuk mengatur komponen alur kerja ke dalam koleksi, Anda dapat menambahkan tag kustom ke file SQLX dari jenis berikut:
table
view
incremental
assertion
operations
Selama eksekusi alur kerja, Anda dapat hanya mengeksekusi file dengan tag yang dipilih.
Dengan Cloud Composer atau Workflows bersama dengan Cloud Scheduler, Anda dapat membuat jadwal yang menjalankan alur kerja Dataform dengan tag yang dipilih pada interval tertentu.
Tambahkan tag
Anda dapat menambahkan beberapa tag ke file SQLX.
Untuk menambahkan tag ke file SQLX, ikuti langkah-langkah berikut:
- Buka ruang kerja pengembangan Anda.
- Di panel Files, luaskan
definitions/
. - Pilih file SQLX.
Di blok
config
, tambahkan tag dalam format berikut:tags: ["CUSTOM_TAG"]
Ganti
CUSTOM_TAG
dengan tag Anda.Opsional: Untuk menambahkan beberapa tag, pisahkan dengan koma (
,
).Opsional: Klik Format.
Contoh kode berikut menunjukkan tampilan user_counts
dengan tag daily
dan
hourly
:
config {
type: "view",
name: "user_counts",
tags: ["daily", "hourly"]
}
Langkah berikutnya
- Untuk mempelajari cara mengonfigurasi setelan Dataform di
workflow_settings.yaml
, lihat Mengonfigurasi setelan alur kerja Dataform. - Untuk mempelajari cara menguji data tabel dengan pernyataan, lihat Menguji tabel dengan pernyataan.
- Untuk mempelajari cara menggunakan kembali kode dengan menyertakan, lihat Menggunakan kembali kode di satu repositori dengan menyertakan.
- Untuk mempelajari cara memicu eksekusi secara manual, lihat Memicu eksekusi.
- Untuk mempelajari cara menambahkan tag kebijakan BigQuery di Dataform, lihat Menambahkan tag kebijakan BigQuery.