Menyiapkan data dengan Gemini
Dokumen ini menjelaskan cara membuat dan mengelola saran kode SQL untuk penyiapan data di BigQuery.
Untuk mengetahui informasi selengkapnya, lihat Pengantar penyiapan data BigQuery.
Sebelum memulai
Membuka editor persiapan data di BigQuery
Anda dapat membuka editor penyiapan data di BigQuery dengan membuat penyiapan data baru, membuat penyiapan data dari tabel yang ada, atau membuka penyiapan data yang ada. Untuk mengetahui informasi selengkapnya tentang apa yang terjadi saat Anda membuat persiapan data, lihat Titik entri persiapan data.
Di halaman BigQuery, Anda dapat membuka editor persiapan data dengan cara berikut:
Buat baru
Untuk membuat persiapan data baru di BigQuery, ikuti langkah-langkah berikut:
- Di Google Cloud konsol, buka halaman BigQuery.
Buka BigQuery - Buka daftar Buat baru, lalu klik Penyiapan data. Editor penyiapan data ditampilkan di tab penyiapan data baru tanpa judul.
- Di kotak penelusuran editor, masukkan nama tabel atau kata kunci Anda, lalu pilih tabel. Editor penyiapan data untuk tabel akan terbuka,
menampilkan pratinjau data Anda di tab Data, dan serangkaian
saran penyiapan data awal dari Gemini.
Resource Penyiapan data akan muncul di panel Explorer, tempat Anda dapat mengakses penyiapan ini di masa mendatang. - Opsional: Untuk menyederhanakan tampilan, aktifkan mode layar penuh dengan mengklik layar penuh Layar penuh.
Buat baru dari tabel
Untuk membuat penyiapan data baru dari tabel yang ada, ikuti langkah-langkah berikut:
- Di Google Cloud konsol, buka halaman BigQuery.
Buka BigQuery - Di panel Explorer, tahan kursor ke tabel.
- Klik more_vert
Menu > Kueri di > Penyiapan data. Editor penyiapan data untuk tabel akan terbuka, menampilkan pratinjau
data Anda di tab Data, dan kumpulan awal saran penyiapan data
dari Gemini.
Resource Penyiapan data akan muncul di panel Explorer, tempat Anda dapat mengakses penyiapan ini di masa mendatang. - Opsional: Untuk menyederhanakan tampilan, aktifkan mode layar penuh dengan mengklik layar penuh Layar penuh.
Buka yang ada
Untuk membuka editor penyiapan data yang sudah ada, ikuti langkah-langkah berikut:
- Di Google Cloud konsol, buka halaman BigQuery.
Buka BigQuery - Di panel Explorer, klik nama project dan persiapan data.
- Pilih penyiapan data yang ada. Tampilan grafik pipeline persiapan data akan ditampilkan.
- Pilih salah satu node dalam grafik. Editor penyiapan data untuk tabel akan terbuka, menampilkan pratinjau data Anda di tab Data, dan kumpulan awal saran penyiapan data dari Gemini.
- Opsional: Untuk menyederhanakan tampilan, aktifkan mode layar penuh dengan mengklik layar penuh Layar penuh.
Menambahkan langkah-langkah penyiapan data
Anda menyiapkan data dalam beberapa langkah. Anda dapat melihat pratinjau atau menerapkan langkah-langkah yang disarankan oleh Gemini. Anda juga dapat meningkatkan kualitas saran, atau menerapkan langkah-langkah Anda sendiri.
Menerapkan dan meningkatkan kualitas saran dari Gemini
Saat Anda membuka editor penyiapan data untuk tabel, Gemini akan memeriksa data dan skema dari tabel yang Anda muat serta membuat saran filter dan transformasi. Saran muncul di kartu dalam daftar Langkah-Langkah.
Gambar berikut menunjukkan tempat Anda dapat menerapkan dan meningkatkan kualitas langkah-langkah yang disarankan oleh Gemini:
Untuk menerapkan saran dari Gemini sebagai langkah persiapan data, lakukan hal berikut:
- Di tampilan data, klik nama kolom atau sel tertentu. Gemini membuat saran untuk memfilter dan mengubah data.
Opsional: Untuk meningkatkan kualitas saran, edit nilai satu hingga tiga sel dalam tabel untuk menunjukkan seperti apa nilai dalam kolom seharusnya. Misalnya, masukkan tanggal sesuai dengan format yang Anda inginkan untuk semua tanggal. Gemini akan membuat saran baru berdasarkan perubahan Anda.
Gambar berikut menunjukkan cara mengedit nilai untuk meningkatkan kualitas langkah-langkah yang disarankan oleh Gemini:
Pilih kartu saran.
- Opsional: Untuk melihat pratinjau hasil kartu saran, klik Pratinjau.
- Opsional: Untuk mengubah kartu saran menggunakan bahasa alami, klik Edit.
Klik Terapkan.
Menambahkan langkah-langkah dengan bahasa alami atau ekspresi SQL
Jika saran yang ada tidak memenuhi kebutuhan Anda, tambahkan langkah. Pilih kolom atau jenis langkah, lalu deskripsikan apa yang Anda inginkan menggunakan bahasa alami.
Menambahkan transformasi
- Di tampilan data atau skema, pilih opsi Transformasi. Anda juga dapat memilih kolom atau menambahkan contoh untuk membantu Gemini memahami transformasi data Anda.
- Di kolom Deskripsi, masukkan perintah, seperti
Convert the state column to uppercase
. Klik kirim Kirim.
Gemini membuat ekspresi SQL dan deskripsi baru berdasarkan perintah Anda.
Dalam daftar Kolom target, pilih atau masukkan nama kolom.
Opsional: Untuk memperbarui ekspresi SQL, revisi perintah dan klik send Kirim, atau masukkan ekspresi SQL secara manual.
Opsional: Klik Pratinjau dan tinjau langkahnya.
Klik Terapkan.
Meratakan kolom JSON
Anda dapat menyederhanakan data JSON dari sumber selama penyiapan data. Proses ini, yang disebut perataan, mengekstrak semua pasangan nilai kunci dari kolom JSON sekaligus dan mengubahnya menjadi kolomnya sendiri dalam tabel Anda. Hal ini membantu saat Anda perlu membuat struktur JSON yang rumit lebih mudah dianalisis atau digabungkan dengan data lain.
Gemini untuk BigQuery menyarankan operasi yang mengekstraksi kolom hanya dari tingkat teratas JSON. Jika kolom yang diekstrak ini berisi lebih banyak objek JSON, Anda dapat meratakannya dalam langkah tambahan untuk mengakses isinya.
- Di tampilan data untuk tabel sumber JSON, pilih kolom atau sel.
- Klik Flatten untuk membuat saran.
- Opsional: Untuk memperbarui ekspresi SQL, Anda dapat memasukkan ekspresi SQL secara manual.
- Opsional: Klik Pratinjau dan tinjau langkahnya.
- Klik Terapkan.
Perataan memiliki perilaku berikut:
- Opsi Flatten muncul di tampilan data setelah Anda memilih sel atau kolom yang berisi JSON. Bagian ini tidak muncul secara default saat Anda mengklik Tambahkan langkah.
- Jika kunci JSON tidak ada di baris yang dipilih, saran yang dihasilkan tidak berisi kunci tersebut. Masalah ini dapat menyebabkan beberapa kolom tidak disertakan saat data diratakan.
- Jika nama kolom bertabrakan selama perataan, nama kolom yang berulang akan berakhir dalam
format ini:
_<i>
. Misalnya, jika sudah ada kolom bernamaaddress
, nama kolom baru yang diratakan adalahaddress_1
. - Nama kolom yang diratakan mengikuti konvensi penamaan kolom BigQuery.
- Jika Anda membiarkan kolom kunci JSON kosong, format nama kolom default adalah
f<i>_
.
Memfilter baris
Untuk menambahkan filter yang menghapus baris, ikuti langkah-langkah berikut:
- Dalam tampilan data atau skema, pilih opsi Filter. Anda juga dapat memilih kolom untuk membantu Gemini memahami filter data Anda.
- Di kolom Deskripsi, masukkan perintah, seperti
Column ID should not be NULL
. - Klik Generate. Gemini membuat ekspresi SQL dan deskripsi baru berdasarkan perintah Anda.
- Opsional: Untuk memperbarui ekspresi SQL, revisi perintah, lalu klik send Kirim, atau masukkan ekspresi SQL secara manual.
- Opsional: Klik Pratinjau dan tinjau langkahnya.
- Klik Terapkan.
Format ekspresi filter
Ekspresi SQL untuk filter mempertahankan baris yang cocok dengan kondisi yang ditentukan. Hal ini setara dengan pernyataan SELECT … WHERE SQL_EXPRESSION
.
Misalnya, untuk mempertahankan data jika kolom year
lebih besar dari atau sama dengan 2000
, kondisinya adalah year >= 2000
.
Ekspresi harus mengikuti sintaksis SQL BigQuery untuk
klausa WHERE
.
Mengonfigurasi tabel error dan menambahkan aturan validasi
Anda dapat menambahkan filter yang membuat aturan validasi, yang mengirimkan error ke tabel error atau gagal menjalankan penyiapan data.
Mengonfigurasi tabel error
Untuk mengonfigurasi tabel error, ikuti langkah-langkah berikut:
- Di editor penyiapan data, buka toolbar dan klik Lainnya > Tabel error.
- Klik Aktifkan tabel error.
- Tentukan lokasi tabel.
- Opsional: Tentukan durasi maksimum untuk menyimpan error.
- Klik Simpan.
Menambahkan aturan validasi
Untuk menambahkan aturan validasi, ikuti langkah-langkah berikut:
- Dalam tampilan data atau skema, klik opsi Filter. Anda juga dapat memilih kolom untuk membantu Gemini memahami filter data Anda.
- Masukkan deskripsi untuk langkah.
- Masukkan ekspresi SQL, dalam bentuk klausa
WHERE
. - Opsional: Jika Anda ingin ekspresi SQL bertindak sebagai aturan validasi, centang kotak Failed validation rows go to error table. Anda juga dapat mengubah filter menjadi validasi di toolbar penyiapan data dengan mengklik Lainnya > Tabel error.
- Opsional: Klik Pratinjau dan tinjau langkahnya.
- Klik Terapkan.
Menghapus kolom
Untuk menghapus satu atau beberapa kolom dari penyiapan data, ikuti langkah-langkah berikut:
- Di tampilan data atau skema, pilih kolom yang ingin Anda lepas.
- Klik Lepaskan. Langkah penerapan baru ditambahkan untuk kolom yang dihapus.
Menambahkan operasi gabungan dengan Gemini
Untuk menambahkan langkah operasi gabungan antara dua sumber dalam penyiapan data Anda, ikuti langkah-langkah berikut:
- Di tampilan data untuk node dalam penyiapan data, buka daftar Saran, lalu klik opsi Gabungkan.
- Dalam dialog Tambahkan gabungan, klik Jelajahi, lalu pilih tabel lain yang terlibat dalam operasi gabungan (disebut sebagai sisi kanan gabungan).
- Opsional: Pilih jenis operasi gabungan yang ingin Anda lakukan, seperti Inner join.
Tinjau informasi kunci gabungan yang dihasilkan Gemini di kolom berikut:
- Deskripsi gabungan: Deskripsi bahasa alami ekspresi SQL untuk operasi gabungan. Saat Anda mengedit deskripsi ini dan mengklik kirim Kirim, Gemini akan menyarankan kondisi gabungan SQL baru.
Kondisi gabungan: Ekspresi SQL dalam klausa
ON
untuk operasi gabungan. Anda dapat menggunakan kualifikasiL
danR
untuk merujuk ke tabel sumber kiri dan kanan. Misalnya, untuk menggabungkan kolomcustomer_id
dari tabel kiri ke kolomcustomer_id
dari tabel kanan, masukkanL.customerId = R.customerId
. Penentu ini tidak peka huruf besar/kecil.
Opsional: Untuk mempertajam saran dari Gemini, edit kolom Deskripsi bergabung, lalu klik kirim Kirim.
Opsional: Untuk melihat pratinjau setelan operasi penggabungan penyiapan data Anda, klik Pratinjau.
Klik Terapkan.
Langkah operasi gabung dibuat. Tabel sumber yang Anda pilih (sisi kanan gabungan) dan operasi gabungan tercermin dalam daftar langkah yang diterapkan dan dalam node di tampilan grafik penyiapan data Anda.
Menambahkan atau mengubah tabel tujuan
Untuk menambahkan atau mengubah tabel tujuan bagi output penyiapan data Anda, ikuti langkah-langkah berikut:
- Di tampilan data atau skema, pilih opsi Tujuan.
- Pilih project tempat tabel tujuan disimpan.
- Pilih salah satu set data, atau muat set data baru.
- Masukkan tabel tujuan. Jika tabel tidak ada, penyiapan data akan membuat tabel baru pada proses pertama. Untuk mengetahui informasi selengkapnya, lihat Mode penulisan.
- Pilih set data Anda sebagai set data tujuan.
- Klik Simpan.
Melihat sampel dan skema data untuk langkah yang diterapkan
Untuk melihat detail sampel dan skema pada langkah tertentu dalam penyiapan data, lakukan hal berikut:
- Di editor penyiapan data, buka daftar Langkah-langkah, lalu klik Langkah-langkah yang diterapkan.
- Pilih langkah. Tab Data dan Skema akan muncul, menampilkan sampel data dan skema pada langkah tertentu ini.
Mengedit langkah yang diterapkan
Untuk mengedit langkah yang diterapkan, lakukan hal berikut:
- Di editor penyiapan data, buka daftar Langkah-langkah, lalu klik Langkah-langkah yang diterapkan.
- Pilih langkah.
- Di samping langkah, klik more_vert Menu > Edit.
- Dalam dialog Edit Langkah yang Diterapkan, Anda dapat melakukan hal berikut:
- Edit deskripsi langkah.
- Dapatkan saran dari Gemini dengan mengedit deskripsi dan mengklik kirim Kirim.
- Edit ekspresi SQL.
- Di kolom Target column, pilih kolom.
- Opsional: Klik Pratinjau dan tinjau langkahnya.
- Klik Terapkan.
Menghapus langkah yang diterapkan
Untuk menghapus langkah yang diterapkan, lakukan hal berikut:
- Di editor penyiapan data, buka daftar Langkah-langkah, lalu klik Langkah-langkah yang diterapkan.
- Pilih langkah.
- Klik more_vert Menu > Hapus.
Menjalankan persiapan data
Setelah menambahkan langkah-langkah penyiapan data, mengonfigurasi tujuan, dan memperbaiki error validasi, Anda dapat menjalankan uji coba pada sampel data, atau men-deploy langkah-langkah dan menjadwalkan penyiapan data. Untuk mengetahui informasi selengkapnya, lihat Menjadwalkan persiapan data.
Memuat ulang contoh persiapan data
Data dalam sampel tidak diperbarui secara otomatis. Jika data dalam tabel sumber untuk penyiapan data telah berubah, tetapi perubahan tersebut tidak tercermin dalam sampel data penyiapan, klik Lainnya > Perbarui sampel.
Langkah berikutnya
- Pelajari cara menjadwalkan penyiapan data.
- Pelajari cara mengelola persiapan data.
- Pelajari kuota dan batas untuk Gemini di BigQuery.
- Tinjau harga Gemini in BigQuery.