Menganalisis dengan BigQuery data canvas

Dokumen ini menjelaskan cara menggunakan kanvas data untuk analisis data. Anda juga dapat mengelola metadata kanvas data menggunakan Dataplex.

Kanvas data BigQuery Studio, yang merupakan fitur Gemini di BigQuery, memungkinkan Anda menemukan, mentransformasi, membuat kueri, dan memvisualisasikan data menggunakan perintah bahasa alami dan antarmuka grafis untuk alur kerja analisis.

Untuk alur kerja analisis, kanvas data BigQuery menggunakan grafik asiklik terarah (DAG), yang menyediakan tampilan grafis alur kerja Anda. Di kanvas data BigQuery, Anda dapat melakukan iterasi pada hasil kueri dan menggunakan beberapa cabang pertanyaan di satu tempat.

Kanvas data BigQuery dirancang untuk mempercepat tugas analisis dan membantu tenaga profesional data seperti analis data, engineer data, dan lainnya dalam perjalanan mereka dari data ke insight. Anda tidak perlu memiliki pengetahuan teknis tentang alat tertentu, hanya pemahaman dasar tentang membaca dan menulis SQL. Kanvas data BigQuery berfungsi dengan metadata Dataplex untuk mengidentifikasi tabel yang sesuai berdasarkan bahasa alami.

BigQuery data canvas tidak dimaksudkan untuk digunakan langsung oleh pengguna bisnis.

Kanvas data BigQuery menggunakan Gemini di BigQuery untuk menemukan data Anda, membuat SQL, membuat diagram, dan membuat ringkasan data.

Pelajari cara dan waktu Gemini untuk Google Cloud menggunakan data Anda.

Kemampuan

Kanvas data BigQuery memungkinkan Anda melakukan hal berikut:

  • Gunakan kueri natural language atau sintaksis penelusuran kata kunci dengan metadata Dataplex untuk menemukan aset seperti tabel, tampilan, atau tampilan virtual.

  • Gunakan bahasa alami untuk kueri SQL dasar seperti berikut:

    • Kueri yang berisi klausa FROM, fungsi matematika, array, dan struct.
    • Operasi JOIN untuk dua tabel.
  • Buat visualisasi kustom menggunakan bahasa alami untuk mendeskripsikan apa yang Anda inginkan.

  • Mengotomatiskan insight data.

Batasan

  • Perintah bahasa alami mungkin tidak berfungsi dengan baik dengan hal berikut:

    • BigQuery ML
    • Apache Spark
    • Tabel objek
    • BigLake
    • INFORMATION_SCHEMA penayangan
    • JSON
    • Kolom bertingkat dan berulang.
    • Fungsi dan jenis data yang kompleks seperti DATETIME dan TIMEZONE
  • Visualisasi data tidak berfungsi dengan diagram peta geografis.

Praktik terbaik perintah

Dengan teknik perintah yang tepat, Anda dapat membuat kueri SQL yang kompleks. Saran berikut membantu kanvas data BigQuery meningkatkan kualitas perintah bahasa alam Anda untuk meningkatkan akurasi kueri:

  • Tulis dengan jelas. Nyatakan permintaan Anda dengan jelas dan hindari permintaan yang tidak jelas.

  • Ajukan pertanyaan langsung. Untuk mendapatkan jawaban yang paling tepat, ajukan satu pertanyaan satu per satu, dan buat perintah Anda ringkas. Jika Anda awalnya memberikan perintah dengan lebih dari satu pertanyaan, cantumkan setiap bagian pertanyaan yang berbeda sehingga jelas bagi Gemini.

  • Berikan petunjuk yang fokus dan jelas. Tekankan istilah-istilah penting dalam perintah Anda.

  • Menentukan urutan operasi. Berikan petunjuk dengan cara yang jelas dan teratur. Bagi tugas menjadi langkah-langkah kecil yang terfokus.

  • Menyempurnakan dan melakukan iterasi. Coba berbagai frasa dan pendekatan untuk melihat mana yang menghasilkan hasil terbaik.

Untuk mengetahui informasi selengkapnya, lihat Praktik terbaik untuk kanvas data BigQuery.

Sebelum memulai

  1. Pastikan Gemini di BigQuery diaktifkan untuk project Google Cloud Anda. Administrator biasanya melakukan langkah ini.
  2. Pastikan Anda memiliki izin Identity and Access Management (IAM) yang diperlukan untuk menggunakan kanvas data BigQuery.
  3. Untuk mengelola metadata kanvas data di Dataplex, pastikan Dataplex API diaktifkan di project Google Cloud Anda.

Peran yang diperlukan

Untuk mendapatkan izin yang Anda perlukan untuk menggunakan kanvas data BigQuery, minta administrator untuk memberi Anda peran IAM berikut di project:

Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.

Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya.

Untuk mengetahui informasi lebih lanjut tentang peran dan izin IAM di BigQuery, baca Pengantar IAM.

Untuk mengelola metadata kanvas data di Dataplex, pastikan Anda memiliki peran Dataplex dan izin dataform.repositories.get yang diperlukan.

Jenis node

Kanvas adalah kumpulan satu atau beberapa node. Node dapat terhubung dalam urutan apa pun. BigQuery data canvas memiliki jenis node berikut:

  • Teks
  • Telusuri
  • Tabel
  • SQL
  • Visualisasi
  • Insight

Node teks

Di BigQuery data canvas, node teks memungkinkan Anda menambahkan konten teks kaya ke kanvas. Alat ini berguna untuk menambahkan penjelasan, catatan, atau petunjuk ke kanvas, sehingga memudahkan Anda dan orang lain untuk memahami konteks dan tujuan analisis. Anda dapat memasukkan konten teks apa pun yang diinginkan ke editor node teks, termasuk Markdown untuk pemformatan. Kemampuan ini memungkinkan Anda membuat blok teks yang informatif dan menarik secara visual.

Dari node teks, Anda dapat melakukan hal berikut:

  • Hapus node.
  • Debug node.
  • Buat duplikat node.

Menelusuri node

Di BigQuery data canvas, node penelusuran memungkinkan Anda menemukan dan menggabungkan aset data ke dalam kanvas. Model ini berfungsi sebagai jembatan antara kueri bahasa natural atau penelusuran kata kunci dan data sebenarnya yang ingin Anda gunakan.

Anda memberikan kueri penelusuran, baik dengan bahasa alami maupun menggunakan kata kunci. Node penelusuran menelusuri aset data Anda. Solusi ini memanfaatkan metadata Dataplex untuk meningkatkan kesadaran konteks. Kanvas data BigQuery juga menyarankan tabel, kueri, dan kueri tersimpan yang baru-baru ini digunakan.

Node penelusuran menampilkan daftar aset data yang relevan dan cocok dengan kueri Anda. Hal ini mempertimbangkan nama kolom dan deskripsi tabel. Kemudian, Anda dapat memilih aset yang ingin ditambahkan ke kanvas data sebagai node tabel, tempat Anda dapat menganalisis dan memvisualisasikan data lebih lanjut.

Dari node penelusuran, Anda dapat melakukan hal berikut:

  • Hapus node.
  • Debug node.
  • Buat duplikat node.

Node tabel

Di BigQuery data canvas, node tabel mewakili tabel tertentu yang telah Anda gabungkan ke dalam alur kerja analisis. Tabel ini merepresentasikan data yang sedang Anda tangani dan memungkinkan Anda berinteraksi dengannya secara langsung.

Node tabel menampilkan informasi tentang tabel, seperti nama, skema, dan pratinjau data. Anda dapat berinteraksi dengan tabel dengan melihat detail seperti skema tabel, detail tabel, dan pratinjau tabel.

Dari node tabel, Anda dapat melakukan hal berikut:

  • Hapus node.
  • Debug node.
  • Buat duplikat node.
  • Jalankan node.
  • Jalankan node dan node berikut.

Dalam kanvas data, Anda dapat melakukan hal berikut:

  • Buat kueri hasil di node SQL baru.
  • Gabungkan hasilnya ke tabel lain.

Node SQL

Di BigQuery data canvas, node SQL memungkinkan Anda menjalankan kueri SQL kustom langsung dalam kanvas. Anda dapat menulis kode SQL langsung di editor node SQL atau menggunakan perintah bahasa alami untuk membuat SQL.

Node SQL mengeksekusi kueri SQL yang disediakan terhadap sumber data yang ditentukan. Node SQL menghasilkan tabel hasil, yang kemudian dapat dihubungkan ke node lain di kanvas untuk analisis atau visualisasi lebih lanjut.

Setelah kueri berjalan, Anda dapat mengekspornya sebagai kueri terjadwal, mengekspor hasil kueri, atau membagikan kanvas, mirip dengan menjalankan kueri interaktif.

Dari node SQL, Anda dapat melakukan hal berikut:

  • Mengekspor pernyataan SQL sebagai kueri terjadwal.
  • Hapus node.
  • Debug node.
  • Buat duplikat node.
  • Jalankan node.
  • Jalankan node dan node berikut.

Dalam kanvas data, Anda dapat melakukan hal berikut:

  • Buat kueri hasil di node SQL baru.
  • Visualisasikan hasil di node visualisasi.
  • Buat insight tentang hasil di node insight.
  • Gabungkan hasilnya ke tabel lain.

Node visualisasi

Di BigQuery data canvas, node visualisasi memungkinkan Anda menampilkan data secara visual, sehingga mempermudah pemahaman tren, pola, dan insight. Alat ini menyediakan berbagai jenis diagram yang dapat dipilih, sehingga Anda dapat memilih dan menyesuaikan visualisasi terbaik untuk data Anda.

Node visualisasi menggunakan tabel sebagai input, yang dapat berupa hasil kueri SQL atau node tabel. Berdasarkan jenis diagram yang dipilih dan data dalam tabel input, node visualisasi akan membuat diagram. Anda dapat memilih Auto-Chart untuk mengizinkan BigQuery memilih jenis diagram terbaik untuk data Anda. Node visualisasi kemudian menampilkan diagram yang dihasilkan.

Node visualisasi memungkinkan Anda menyesuaikan diagram, termasuk mengubah warna, label, dan sumber data. Anda juga dapat mengekspor diagram sebagai file PNG.

Visualisasikan data menggunakan jenis grafik berikut:

  • Diagram batang
  • Peta panas
  • Grafik garis
  • Diagram lingkaran
  • Diagram sebar

Dari node visualisasi, Anda dapat melakukan hal berikut:

  • Ekspor diagram sebagai file PNG.
  • Debug node.
  • Buat duplikat node.
  • Jalankan node.
  • Jalankan node dan node berikut.

Dalam kanvas data, Anda dapat melakukan hal berikut:

  • Buat insight tentang hasil di node insight.
  • Edit visualisasi.

Node insight

Di BigQuery data canvas, node insight memungkinkan Anda membuat insight dan ringkasan dari data dalam data canvas. Hal ini membantu Anda menemukan pola, menilai kualitas data, dan melakukan analisis statistik di kanvas. Alat ini mengidentifikasi tren, pola, anomali, dan korelasi dalam data Anda, serta menghasilkan ringkasan yang ringkas dan jelas dari hasil analisis data.

Untuk mengetahui informasi selengkapnya tentang insight data, lihat Menghasilkan insight data di BigQuery.

Dari node insight, Anda dapat melakukan hal berikut:

  • Hapus node.
  • Buat duplikat node.
  • Jalankan node.

Menggunakan kanvas data BigQuery

Anda dapat menggunakan kanvas data BigQuery di konsol, kueri, atau tabel Google Cloud .

  1. Buka halaman BigQuery.

    Buka BigQuery

  2. Di editor kueri, di samping SQL query, klik Create new, lalu klik Data canvas.

    Membuat ikon kanvas data.

  3. Di kolom perintah Natural language, masukkan perintah bahasa alami.

    Misalnya, jika Anda memasukkan Find me tables related to trees, kanvas data BigQuery akan menampilkan daftar kemungkinan tabel, termasuk set data publik seperti bigquery-public-data.usfs_fia.plot_tree atau bigquery-public-data.new_york_trees.tree_species.

  4. Pilih tabel.

    Node tabel untuk tabel yang dipilih ditambahkan ke kanvas data BigQuery. Untuk melihat informasi skema, melihat detail tabel, atau melihat pratinjau data, pilih berbagai tab di node tabel.

Contoh berikut menunjukkan berbagai cara untuk menggunakan kanvas data BigQuery dalam alur kerja analisis.

Contoh alur kerja: Menemukan, membuat kueri, dan memvisualisasikan data

Dalam contoh ini, Anda menggunakan perintah bahasa alami di kanvas data BigQuery untuk menemukan data, membuat kueri, dan mengedit kueri. Kemudian, Anda membuat diagram.

Perintah 1: Temukan data

  1. Di Google Cloud konsol, buka halaman BigQuery.

    Buka BigQuery

  2. Di editor kueri, di samping SQL query, klik Create new, lalu klik Data canvas.

    Membuat ikon kanvas data.

  3. Klik Telusuri data.

  4. Klik filter_list Edit search filters, lalu, di panel Filter search, klik tombol BigQuery public datasets ke posisi aktif.

  5. Di kolom perintah Natural language, masukkan perintah natural language berikut:

    Chicago taxi trips
    

    Kanvas data BigQuery menghasilkan daftar tabel potensial berdasarkan metadata Dataplex. Anda dapat memilih beberapa tabel.

  6. Pilih tabel bigquery-public-data.chicago_taxi_trips.taxi_trips, lalu klik Tambahkan ke kanvas.

    Node tabel untuk taxi_trips ditambahkan ke kanvas data BigQuery. Untuk melihat informasi skema, melihat detail tabel, atau melihat pratinjau data, pilih berbagai tab di node tabel.

Perintah 2: Buat kueri SQL di tabel yang dipilih

Untuk membuat kueri SQL untuk tabel bigquery-public-data.chicago_taxi_trips.taxi_trips, lakukan hal berikut:

  1. Di kanvas data, klik Kueri.

  2. Di kolom perintah Natural language, masukkan perintah berikut:

    Get me the 100 longest trips
    

    Kanvas data BigQuery menghasilkan kueri SQL yang mirip dengan yang berikut:

    SELECT
      taxi_id,
      trip_start_timestamp,
      trip_end_timestamp,
      trip_miles
    FROM
      `bigquery-public-data.chicago_taxi_trips.taxi_trips`
    ORDER BY
      trip_miles DESC
    LIMIT
      100;

Perintah 3: Edit kueri

Untuk mengedit kueri yang Anda buat, Anda dapat mengedit kueri secara manual, atau Anda dapat mengubah perintah bahasa alami dan membuat ulang kueri. Dalam contoh ini, Anda menggunakan perintah bahasa alami untuk mengedit kueri agar hanya memilih perjalanan yang dibayar pelanggan dengan uang tunai.

  1. Di kolom perintah Natural language, masukkan perintah berikut:

    Get me the 100 longest trips where the payment type is cash
    

    Kanvas data BigQuery menghasilkan kueri SQL yang mirip dengan yang berikut:

    SELECT
      taxi_id,
      trip_start_timestamp,
      trip_end_timestamp,
      trip_miles
    FROM
      `PROJECT_ID.chicago_taxi_trips_123123.taxi_trips`
    WHERE
      payment_type = 'Cash'
    ORDER BY
      trip_miles DESC
    LIMIT
      100;

    Pada contoh sebelumnya, PROJECT_ID adalah ID project Google Cloud Anda.

  2. Untuk melihat hasil kueri, klik Run.

Membuat diagram

  1. Di kanvas data, klik Visualize.
  2. Klik Create bar chart.

    Kanvas data BigQuery membuat diagram batang yang menunjukkan mil perjalanan paling banyak berdasarkan ID perjalanan. Selain menyediakan diagram, kanvas data BigQuery menyaring beberapa detail utama data yang mendukung visualisasi.

  3. Opsional: Lakukan satu atau beberapa hal berikut:

    • Untuk mengubah diagram, klik Edit, lalu edit diagram di panel Edit visualisasi.
    • Untuk membagikan kanvas data, klik Bagikan, lalu klik Bagikan Link untuk menyalin link kanvas data BigQuery.
    • Untuk membersihkan kanvas data, pilih Tindakan lainnya, lalu pilih Hapus kanvas. Langkah ini akan menghasilkan kanvas kosong.

Contoh alur kerja: Menggabungkan tabel

Dalam contoh ini, Anda menggunakan perintah bahasa alami di kanvas data BigQuery untuk menemukan data dan menggabungkan tabel. Kemudian, Anda mengekspor kueri sebagai notebook.

Perintah 1: Temukan data

  1. Di kolom perintah Natural language, masukkan perintah berikut:

    Information about trees
    

    Kanvas data BigQuery menyarankan beberapa tabel yang memiliki informasi tentang pohon.

  2. Untuk contoh ini, pilih tabel bigquery-public-data.new_york_trees.tree_census_1995, lalu klik Tambahkan ke kanvas.

    Tabel ditampilkan di kanvas.

Perintah 2: Gabungkan tabel di alamatnya

  1. Di kanvas data, klik Gabungkan.

    BigQuery data canvas menyarankan tabel yang akan digabungkan.

  2. Untuk membuka kolom perintah Natural language baru, klik Telusuri tabel.

  3. Di kolom perintah Natural language, masukkan perintah berikut:

    Information about trees
    
  4. Pilih tabel bigquery-public-data.new_york_trees.tree_census_2005, lalu klik Tambahkan ke kanvas.

    Tabel ditampilkan di kanvas.

  5. Di kanvas data, klik Gabungkan.

  6. Di bagian Di kanvas ini, centang kotak Sel tabel, lalu klik OK.

  7. Di kolom perintah Natural language, masukkan perintah berikut:

    Join on address
    

    Kanvas data BigQuery menyarankan kueri SQL untuk menggabungkan kedua tabel ini berdasarkan alamatnya:

    SELECT
      *
    FROM
      `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015
    JOIN
      `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995
    ON
      t2015.address = t1995.address;
  8. Untuk menjalankan kueri dan melihat hasilnya, klik Run.

Mengekspor kueri sebagai notebook

Dengan BigQuery data canvas, Anda dapat mengekspor kueri sebagai notebook.

  1. Di kanvas data, klik Export as notebook.
  2. Di panel Save Notebook, masukkan nama untuk notebook dan region tempat Anda ingin menyimpannya.
  3. Klik Simpan. Notebook berhasil dibuat.
  4. Opsional: Untuk melihat notebook yang dibuat, klik Buka.

Contoh alur kerja: Mengedit diagram menggunakan perintah

Dalam contoh ini, Anda menggunakan perintah bahasa alami di kanvas data BigQuery untuk menemukan, mengkueri, dan memfilter data, lalu mengedit detail visualisasi.

Perintah 1: Temukan data

  1. Untuk menemukan data tentang nama-nama di Amerika Serikat, masukkan perintah berikut:

    Find data about USA names
    

    Kanvas data BigQuery menghasilkan daftar tabel.

  2. Untuk contoh ini, pilih tabel bigquery-public-data.usa_names.usa_1910_current, lalu klik Tambahkan ke kanvas.

Perintah 2: Buat kueri data

  1. Untuk membuat kueri data, di kanvas data, klik Query, lalu masukkan perintah berikut:

    Summarize this data
    

    BigQuery data canvas menghasilkan kueri yang mirip dengan berikut:

    SELECT
      state,
      gender,
      year,
      name,
      number
    FROM
      `bigquery-public-data.usa_names.usa_1910_current`
  2. Klik Run. Hasil kueri akan ditampilkan.

Perintah 3: Memfilter data

  1. Di kanvas data, klik Query these results.
  2. Untuk memfilter data, di kolom perintah SQL, masukkan perintah berikut:

    Get me the top 10 most popular names in 1980
    

    BigQuery data canvas menghasilkan kueri yang mirip dengan berikut:

    SELECT
      name,
      SUM(number) AS total_count
    FROM
      `bigquery-public-data`.usa_names.usa_1910_current
    WHERE
      year = 1980
    GROUP BY
      name
    ORDER BY
      total_count DESC
    LIMIT
      10;

    Saat menjalankan kueri, Anda akan mendapatkan tabel dengan sepuluh nama paling umum dari anak-anak yang lahir pada tahun 1980.

Membuat dan mengedit diagram

  1. Di kanvas data, klik Visualize.

    Kanvas data BigQuery menyarankan beberapa opsi visualisasi, termasuk diagram batang, diagram lingkaran, diagram garis, dan visualisasi kustom.

  2. Untuk contoh ini, klik Create bar chart.

    Kanvas data BigQuery membuat diagram batang yang mirip dengan berikut:

    Diagram batang sepuluh nama teratas.

Selain menyediakan diagram, kanvas data BigQuery merangkum beberapa detail utama data yang mendukung visualisasi. Anda dapat mengubah diagram dengan mengklik Visualization details dan mengedit diagram di panel samping.

Perintah 4: Mengedit detail visualisasi

  1. Di kolom perintah Visualisasi, masukkan hal berikut:

    Create a bar chart sorted high to low, with a gradient
    

    Kanvas data BigQuery membuat diagram batang yang mirip dengan berikut:

    Diagram batang sepuluh nama teratas diurutkan.

  2. Opsional: Untuk melakukan perubahan lebih lanjut, klik Edit.

    Panel Edit visualisasi akan ditampilkan. Anda dapat mengedit detail seperti judul diagram, nama sumbu x, dan nama sumbu y. Selain itu, jika mengklik tab JSON Editor, Anda dapat langsung mengedit diagram berdasarkan nilai JSON.

Bekerja dengan asisten Gemini

Anda dapat menggunakan pengalaman chat yang didukung Gemini untuk menggunakan kanvas data BigQuery. Asisten chat dapat membuat node berdasarkan permintaan Anda, menjalankan kueri, dan membuat visualisasi. Anda dapat memilih tabel untuk digunakan asisten, dan Anda dapat menambahkan petunjuk ke asisten untuk mengarahkan perilakunya. Asisten berfungsi dengan kanvas data baru atau yang sudah ada.

Untuk menggunakan asisten Gemini, lakukan hal berikut:

  1. Untuk membuka asisten, di kanvas data, klik spark Buka Asisten Kanvas Data.
  2. Di kolom Ask a data question, masukkan perintah bahasa alami—misalnya, salah satu dari perintah berikut:

    • Show me interesting statistics of my data.
    • Make a chart based on my data, sorted high to low.
    • I want to see sample data from my table.

    Respons menyertakan satu atau beberapa node berdasarkan permintaan. Misalnya, jika Anda meminta asisten untuk membuat diagram data, asisten akan membuat node visualisasi di kanvas data.

    Saat mengklik kolom Ajukan pertanyaan data, Anda juga dapat melakukan hal berikut:

    • Untuk menambahkan data, klik Setelan.
    • Untuk menambahkan petunjuk, klik Setelan.
  3. Untuk terus menggunakan asisten, tambahkan perintah bahasa alami tambahan.

Anda dapat terus membuat perintah bahasa alami saat menggunakan kanvas data.

Tambahkan data

Saat menggunakan antarmuka chat Gemini, Anda dapat menambahkan data agar asisten mengetahui set data mana yang akan dirujuk. Asisten meminta Anda untuk memilih tabel sebelum menjalankan perintah apa pun. Saat menelusuri data dalam asisten, Anda dapat membatasi cakupan data yang dapat ditelusuri ke semua project, project berbintang, atau project saat ini. Anda juga dapat memutuskan apakah akan menyertakan set data publik dalam penelusuran atau tidak.

Untuk menambahkan data ke asisten Gemini, lakukan hal berikut:

  1. Untuk membuka asisten, di kanvas data, klik spark Buka Asisten Kanvas Data.
  2. Klik Setelan, lalu klik Tambahkan Data.
  3. Opsional: Untuk memperluas hasil penelusuran agar menyertakan set data publik, klik tombol Public datasets ke posisi aktif.
  4. Opsional: Untuk mengubah cakupan hasil penelusuran ke project lain, pilih opsi project yang sesuai dari menu Cakupan.
  5. Centang kotak untuk setiap tabel yang ingin Anda tambahkan ke asisten.
    1. Untuk menelusuri tabel yang tidak disarankan oleh asisten, klik Telusuri tabel.
    2. Di kolom perintah Natural language, masukkan perintah yang menjelaskan tabel yang Anda cari, lalu tekan Enter.
    3. Centang kotak untuk setiap tabel yang ingin Anda tambahkan ke asisten, lalu klik Ok.
  6. Tutup panel Setelan asisten kanvas.

Asisten mendasarkan analisisnya pada data yang Anda pilih.

Tambahkan petunjuk

Saat menggunakan antarmuka chat Gemini, Anda dapat menambahkan petunjuk agar asisten mengetahui cara berperilaku. Petunjuk ini diterapkan ke semua perintah dalam kanvas data. Contoh potensi petunjuk meliputi hal berikut:

  • Visualize trends over time.
  • Chart colors: Red (negative), Green (positive)
  • Domain: USA

Untuk menambahkan petunjuk ke asisten, lakukan hal berikut:

  1. Untuk membuka asisten, di kanvas data, klik spark Buka Asisten Kanvas Data.
  2. Klik Setelan.
  3. Di kolom Instructions, tambahkan daftar petunjuk untuk asisten, lalu tutup panel Canvas assistant settings.

Asisten akan mengingat petunjuk tersebut dan menerapkannya ke perintah mendatang.

Praktik terbaik Gemini Assistant

Untuk mendapatkan hasil terbaik saat menggunakan asisten kanvas data BigQuery, ikuti praktik terbaik berikut:

  • Spesifik dan tidak ambigu. Nyatakan dengan jelas apa yang ingin Anda hitung, analisis, atau visualisasikan. Misalnya, sebagai ganti Analyze trip data, ucapkan Calculate the average trip duration for trips starting in council district eight.

  • Memastikan konteks data yang akurat. Asisten hanya dapat menggunakan data yang Anda berikan. Pastikan semua tabel dan kolom yang relevan telah ditambahkan ke kanvas.

  • Mulai dengan sederhana, lalu lakukan iterasi. Mulailah dengan pertanyaan sederhana untuk memastikan asisten memahami struktur dan data dasar. Misalnya, ucapkan Show total trips by subscriber_type terlebih dahulu, lalu ucapkan Show total trips by subscriber_type and break down the result by council_district.

  • Pecahkan pertanyaan kompleks. Untuk proses multi-langkah, pertimbangkan untuk menyusun perintah dengan jelas dengan bagian yang berbeda, atau menggunakan perintah terpisah untuk setiap langkah utama. Misalnya, ucapkan First, find the top five busiest stations by trip count. Second, calculate the average trip duration for trips starting from only those top five stations.

  • Nyatakan penghitungan dengan jelas. Tentukan penghitungan yang dipilih, seperti SUM, MAX, atau AVERAGE. Misalnya, ucapkan Find the MAX trip duration per bike_id.

  • Gunakan petunjuk sistem untuk konteks dan preferensi persisten. Gunakan petunjuk sistem untuk menyatakan aturan informasi, dan preferensi yang berlaku di semua perintah.

  • Tinjau kanvas. Selalu tinjau node yang dihasilkan untuk memverifikasi bahwa logika sesuai dengan permintaan Anda dan hasilnya akurat.

  • Bereksperimen. Coba berbagai frasa, tingkat detail, dan struktur perintah untuk mempelajari cara asisten merespons data dan kebutuhan analisis spesifik Anda.

  • Referensi nama kolom. Jika memungkinkan, gunakan nama kolom sebenarnya dari data yang Anda pilih. Misalnya, sebagai ganti Show trips by subscriber type, ucapkan Show the count of trips grouped by subscriber_type and start_station_name.

Contoh alur kerja: Bekerja dengan asisten Gemini

Dalam contoh ini, Anda menggunakan perintah bahasa alami dengan asisten Gemini untuk menemukan, membuat kueri, dan memvisualisasikan data.

  1. Di Google Cloud konsol, buka halaman BigQuery.

    Buka BigQuery

  2. Di editor kueri, di samping SQL query, klik Create new, lalu klik Data canvas.

    Membuat ikon kanvas data.

  3. Klik Telusuri data.

  4. Klik filter_list Edit search filters, lalu, di panel Filter search, klik tombol BigQuery public datasets ke posisi aktif.

  5. Di kolom perintah Natural language, masukkan perintah natural language berikut:

    bikeshare
    

    Kanvas data BigQuery menghasilkan daftar tabel potensial berdasarkan metadata Dataplex. Anda dapat memilih beberapa tabel.

  6. Pilih tabel bigquery-public-data.austin_bikeshare.bikeshare_stations dan bigquery-public-data.austin_bikeshare.bikeshare_trips, lalu klik Tambahkan ke kanvas.

    Node tabel untuk setiap tabel yang dipilih akan ditambahkan ke kanvas data BigQuery. Untuk melihat informasi skema, melihat detail tabel, atau melihat pratinjau data, pilih berbagai tab di node tabel.

  7. Untuk membuka asisten, di kanvas data, klik spark Buka Asisten Kanvas Data.

  8. Klik Setelan.

  9. Di kolom Instructions, tambahkan petunjuk berikut untuk asisten:

    Tasks:
      - Visualize findings with charts
      - Show many charts per question
      - Make sure to cover each part via a separate line of reasoning
    
  10. Tutup panel Setelan asisten kanvas.

  11. Di kolom Ask a data question, masukkan perintah bahasa alami berikut:

    Show the number of trips by council district and subscriber type
    
  12. Anda dapat terus memasukkan perintah di kolom Ajukan pertanyaan data. Masukkan perintah natural language berikut:

    What are most popular stations among the top 5 subscriber types
    
  13. Masukkan perintah akhir:

    What station is least used to start and end a trip
    

    Setelah Anda mengajukan semua perintah yang relevan, kanvas akan diisi dengan node kueri dan visualisasi yang relevan sesuai dengan perintah dan petunjuk yang Anda berikan kepada asisten. Terus masukkan perintah atau ubah perintah yang ada untuk mendapatkan hasil yang Anda cari.

Melihat semua kanvas data

Untuk melihat daftar semua kanvas data dalam project Anda, lakukan langkah berikut:

  1. Di konsol Google Cloud , buka halaman BigQuery.

    Buka BigQuery

  2. Di panel Explorer, klik View actions di samping Data canvases, lalu lakukan salah satu tindakan berikut:

  • Untuk membuka daftar di tab saat ini, klik Tampilkan semua.
  • Untuk membuka daftar di tab baru, klik Tampilkan semua di > Tab baru.
  • Untuk membuka daftar di tab terpisah, klik Tampilkan semua di > Tab terpisah.

Melihat metadata kanvas data

Untuk melihat metadata kanvas data, lakukan hal berikut:

  1. Di konsol Google Cloud , buka halaman BigQuery.

    Buka BigQuery

  2. Di panel Explorer, luaskan project Anda dan folder Kanvas data, dan jika perlu, folder Kanvas data bersama. Klik nama kanvas data yang metadatanya ingin Anda lihat.

  3. Lihat panel Ringkasan untuk melihat informasi tentang kanvas data, seperti region yang digunakan dan tanggal kanvas data terakhir diubah.

Menggunakan versi kanvas data

Anda dapat memilih untuk membuat kanvas data di dalam atau di luar repositori. Pembuatan versi kanvas data ditangani secara berbeda berdasarkan lokasi kanvas data.

Pembuatan versi kanvas data di repositori

Repositori adalah repositori Git yang berada di BigQuery atau dengan penyedia pihak ketiga. Anda dapat menggunakan ruang kerja di repositori untuk melakukan kontrol versi pada kanvas data. Untuk informasi selengkapnya, lihat Menggunakan kontrol versi dengan file.

Pembuatan versi kanvas data di luar repositori

Anda dapat melihat, membandingkan, dan memulihkan versi kanvas data.

Melihat dan membandingkan versi kanvas data

Untuk melihat berbagai versi kanvas data dan membandingkannya dengan versi saat ini, lakukan hal berikut:

  1. Di konsol Google Cloud , buka halaman BigQuery.

    Buka BigQuery

  2. Di panel Explorer, luaskan project Anda dan folder Kanvas data, dan jika perlu, folder Kanvas data bersama. Klik nama kanvas data yang ingin Anda lihat aktivitasnya.

  3. Klik Histori versi untuk melihat daftar versi kanvas data dalam urutan menurun berdasarkan tanggal.

  4. Klik Lihat tindakan di samping versi kanvas data, lalu klik Bandingkan. Panel perbandingan akan terbuka, yang membandingkan versi kanvas data yang Anda pilih dengan versi kanvas data saat ini.

  5. Opsional: Untuk membandingkan versi sebagai bagian dari teks, bukan di panel terpisah, klik Bandingkan, lalu klik Inline.

Memulihkan versi kanvas data

Memulihkan dari panel perbandingan memungkinkan Anda membandingkan versi kanvas data sebelumnya dengan versi saat ini sebelum memilih untuk memulihkannya atau tidak.

  1. Di panel Explorer, luaskan project Anda dan folder Kanvas data, dan jika perlu, folder Kanvas data bersama. Klik nama kanvas data yang ingin Anda pulihkan ke versi sebelumnya.
  2. Klik Histori versi.
  3. Klik Lihat tindakan di samping versi kanvas data yang ingin Anda pulihkan, lalu klik Bandingkan.

    Panel perbandingan akan terbuka, yang membandingkan versi kanvas data yang Anda pilih dengan versi kanvas data terbaru.

  4. Untuk memulihkan versi kanvas data sebelumnya setelah perbandingan, klik Pulihkan.

  5. Klik Konfirmasi.

Mengelola metadata di Dataplex

Dataplex memungkinkan Anda melihat dan mengelola metadata untuk kanvas data. Kanvas data tersedia di Dataplex secara default, tanpa konfigurasi tambahan.

Anda dapat menggunakan Dataplex untuk mengelola kanvas data di semua lokasi BigQuery. Pengelolaan kanvas data di Dataplex tunduk pada kuota dan batas Dataplex serta harga Dataplex.

Dataplex otomatis mengambil metadata berikut dari kanvas data:

  • Nama aset data
  • Induk aset data
  • Lokasi aset data
  • Jenis aset data
  • Project Google Cloud yang sesuai

Dataplex mencatat kanvas data sebagai entri dengan nilai entri berikut:

Grup entri sistem
Grup entri sistem untuk kanvas data adalah @dataform. Untuk melihat detail entri kanvas data di Dataplex, Anda perlu melihat grup entri sistem dataform. Untuk mengetahui petunjuk tentang cara melihat daftar semua entri dalam grup entri, lihat Melihat detail grup entri dalam dokumentasi Dataplex.
Jenis entri sistem
Jenis entri sistem untuk kanvas data adalah dataform-code-asset. Untuk melihat detail kanvas data, Anda perlu melihat jenis entri sistem dataform-code-asset, memfilter hasil dengan filter berbasis aspek, dan menetapkan kolom type di dalam aspek dataform-code-asset ke DATA_CANVAS. Kemudian, pilih entri kanvas data yang dipilih. Untuk petunjuk tentang cara melihat detail jenis entri yang dipilih, lihat Melihat detail jenis entri dalam dokumentasi Dataplex. Untuk petunjuk tentang cara melihat detail entri yang dipilih, lihat Melihat detail entri dalam dokumentasi Dataplex.
Jenis aspek sistem
Jenis aspek sistem untuk kanvas data adalah dataform-code-asset. Untuk memberikan konteks tambahan ke kanvas data di Dataplex dengan menganotasi entri kanvas data dengan aspek, lihat jenis aspek dataform-code-asset, filter hasil dengan filter berbasis aspek, dan tetapkan kolom type di dalam aspek dataform-code-asset ke DATA_CANVAS. Untuk mengetahui petunjuk tentang cara menganotasi entri dengan aspek, lihat Mengelola aspek dan memperkaya metadata dalam dokumentasi Dataplex.
Jenis
Jenis untuk kanvas data adalah DATA_CANVAS. Jenis ini memungkinkan Anda memfilter kanvas data dalam jenis entri sistem dataform-code-asset dan jenis aspek dataform-code-asset menggunakan kueri aspect:dataplex-types.global.dataform-code-asset.type=DATA_CANVAS dalam filter berbasis aspek.

Untuk petunjuk tentang cara menelusuri aset di Dataplex, lihat Menelusuri aset data di Dataplex dalam dokumentasi Dataplex.

Harga

Untuk mengetahui detail harga fitur ini, lihat ringkasan harga Gemini in BigQuery.

Kuota dan batas

Untuk mengetahui informasi tentang kuota dan batas untuk fitur ini, lihat Kuota untuk Gemini di BigQuery.

Berikan masukan

Anda dapat membantu meningkatkan kualitas saran kanvas data BigQuery dengan mengirimkan masukan ke Google. Untuk memberikan masukan, lakukan hal berikut:

  1. Di Google Cloud toolbar konsol, klik Kirim masukan.

  2. Opsional: Untuk menyalin informasi JSON DAG guna memberikan konteks tambahan ke masukan Anda, klik Salin.

  3. Untuk mengisi formulir dan memberikan masukan, klik form.

Setelan berbagi data berlaku untuk seluruh project dan hanya dapat ditetapkan oleh admin project yang memiliki izin IAM serviceusage.services.enable dan serviceusage.services.list. Untuk mengetahui informasi selengkapnya tentang penggunaan data dalam Program Penguji Tepercaya, lihat Gemini dalam Google Cloud Program Penguji Tepercaya.

Untuk memberikan masukan langsung tentang fitur ini, Anda juga dapat menghubungi datacanvas-feedback@google.com.

Langkah berikutnya