Bahasa Pengolahan Data yang dipartisi (DML yang dipartisi) dirancang untuk jenis update dan penghapusan massal berikut:
- Pembersihan berkala dan pembersihan sampah memori. Contohnya adalah menghapus baris lama atau
menetapkan kolom ke
NULL
. - Mengisi ulang kolom baru dengan nilai default. Contohnya adalah menggunakan pernyataan
UPDATE
untuk menyetel nilai kolom baru keFalse
jika saat iniNULL
.
DML yang dipartisi tidak cocok untuk pemrosesan transaksi skala kecil. Jika Anda ingin menjalankan pernyataan pada beberapa baris, gunakan DML transaksional dengan kunci primer yang dapat diidentifikasi. Untuk mengetahui informasi selengkapnya, lihat Menggunakan DML.
Jika Anda perlu melakukan sejumlah besar operasi tulis buta, tetapi tidak memerlukan transaksi atomik, Anda dapat mengubah tabel Spanner secara massal menggunakan operasi tulis batch. Untuk mengetahui informasi selengkapnya, lihat Mengubah data menggunakan operasi tulis batch.
Anda bisa mendapatkan insight tentang kueri DML yang dipartisi aktif dan progresnya dari tabel statistik di database Spanner. Untuk mengetahui informasi selengkapnya, lihat Statistik DML yang dipartisi aktif.
DML dan DML yang dipartisi
Spanner mendukung dua mode eksekusi untuk pernyataan DML:
DML, yang cocok untuk pemrosesan transaksi. Untuk mengetahui informasi selengkapnya, lihat Menggunakan DML.
DML yang dipartisi, yang memungkinkan operasi skala besar di seluruh database dengan dampak minimal pada pemrosesan transaksi serentak dengan mempartisi ruang kunci dan menjalankan pernyataan di seluruh partisi dalam transaksi yang terpisah dan cakupannya lebih kecil. Untuk mengetahui informasi selengkapnya, lihat Menggunakan DML berpartisi.
Tabel berikut menyoroti beberapa perbedaan antara kedua mode eksekusi.
DML | DML yang dipartisi |
---|---|
Baris yang tidak cocok dengan klausa WHERE mungkin dikunci. |
Hanya baris yang cocok dengan klausa WHERE yang dikunci. |
Batas ukuran transaksi berlaku. | Spanner menangani batas transaksi dan batas konkurensi per transaksi. |
Pernyataan tidak harus idempoten. | Pernyataan DML harus idempoten untuk memastikan hasil yang konsisten. |
Transaksi dapat mencakup beberapa pernyataan DML dan SQL. | Transaksi yang dipartisi hanya dapat menyertakan satu pernyataan DML. |
Tidak ada batasan pada kompleksitas pernyataan. | Pernyataan harus dapat dipartisi sepenuhnya. |
Anda membuat transaksi baca-tulis dalam kode klien. | Spanner membuat transaksi. |
Dapat dipartisi dan idempoten
Saat pernyataan DML berpartisi berjalan, baris dalam satu partisi tidak memiliki akses
ke baris dalam partisi lain, dan Anda tidak dapat memilih cara Spanner membuat
partisi. Partisi memastikan skalabilitas, tetapi juga berarti bahwa pernyataan DML yang dipartisi harus dapat dipartisi sepenuhnya. Artinya, pernyataan DML berpartisi harus dapat dinyatakan sebagai gabungan dari serangkaian pernyataan, dengan setiap pernyataan mengakses satu baris tabel dan setiap pernyataan tidak mengakses tabel lain. Misalnya, pernyataan DML yang mengakses
beberapa tabel atau melakukan self-join tidak dapat dipartisi. Jika pernyataan DML tidak dapat dipartisi, Spanner akan menampilkan error BadUsage
.
Pernyataan DML ini sepenuhnya dapat dipartisi, karena setiap pernyataan dapat diterapkan ke satu baris dalam tabel:
UPDATE Singers SET LastName = NULL WHERE LastName = '';
DELETE FROM Albums WHERE MarketingBudget > 10000;
Pernyataan DML ini tidak dapat dipartisi sepenuhnya, karena mengakses beberapa tabel:
# Not fully partitionable
DELETE FROM Singers WHERE
SingerId NOT IN (SELECT SingerId FROM Concerts);
Spanner mungkin menjalankan pernyataan DML yang dipartisi beberapa kali terhadap beberapa partisi karena percobaan ulang tingkat jaringan. Akibatnya, pernyataan dapat dieksekusi lebih dari sekali terhadap baris. Oleh karena itu, pernyataan harus idempoten untuk memberikan hasil yang konsisten. Pernyataan bersifat idempoten jika menjalankannya beberapa kali terhadap satu baris menghasilkan hasil yang sama.
Pernyataan DML ini bersifat idempoten:
UPDATE Singers SET MarketingBudget = 1000 WHERE true;
Pernyataan DML ini tidak bersifat idempoten:
UPDATE Singers SET MarketingBudget = 1.5 * MarketingBudget WHERE true;
Penguncian baris
Spanner memperoleh kunci hanya jika baris adalah kandidat untuk update atau
penghapusan. Perilaku ini berbeda dengan
eksekusi DML, yang mungkin mengunci baca
baris yang tidak cocok dengan klausa WHERE
.
Eksekusi dan transaksi
Apakah pernyataan DML dipartisi atau tidak bergantung pada metode library klien yang Anda pilih untuk dieksekusi. Setiap library klien menyediakan metode terpisah untuk eksekusi DML dan eksekusi DML yang dipartisi.
Anda hanya dapat menjalankan satu pernyataan DML berpartisi dalam panggilan ke metode library klien.
Spanner tidak menerapkan pernyataan DML berpartisi secara atomik di seluruh tabel. Namun, Spanner menerapkan pernyataan DML yang dipartisi secara atomik di setiap partisi.
DML yang dipartisi tidak mendukung commit atau rollback. Spanner mengeksekusi dan menerapkan pernyataan DML secara langsung.
- Jika Anda membatalkan operasi, Spanner akan membatalkan partisi yang sedang dieksekusi dan tidak memulai partisi yang tersisa. Spanner tidak mengembalikan partisi yang telah dieksekusi.
- Jika eksekusi pernyataan menyebabkan error, eksekusi akan berhenti di semua partisi dan Spanner akan menampilkan error tersebut untuk seluruh operasi. Beberapa contoh error adalah pelanggaran batasan jenis data, pelanggaran
UNIQUE INDEX
, dan pelanggaranON DELETE NO ACTION
. Bergantung pada waktu saat eksekusi gagal, pernyataan mungkin berhasil dijalankan terhadap beberapa partisi, dan mungkin tidak pernah dijalankan terhadap partisi lainnya.
Jika pernyataan DML berpartisi berhasil, Spanner akan menjalankan pernyataan tersebut setidaknya sekali terhadap setiap partisi rentang kunci.
Jumlah baris yang diubah
Pernyataan DML berpartisi menampilkan batas bawah jumlah baris yang diubah. Jumlah ini mungkin bukan jumlah pasti baris yang diubah, karena tidak ada jaminan bahwa Spanner menghitung semua baris yang diubah.
Batas transaksi
Spanner membuat partisi dan transaksi yang diperlukan untuk mengeksekusi pernyataan DML terpartisi. Batas transaksi atau batas serentak per transaksi berlaku, tetapi Spanner mencoba menjaga transaksi dalam batas.
Spanner mengizinkan maksimum 20.000 pernyataan DML terpartisi serentak per database.
Fitur yang tidak didukung
Spanner tidak mendukung beberapa fitur untuk DML yang dipartisi:
INSERT
tidak didukung.- Google Cloud console: Anda tidak dapat menjalankan pernyataan DML terpartisi di Google Cloud console.
- Rencana kueri dan pembuatan profil: Google Cloud CLI dan library klien tidak mendukung rencana kueri dan pembuatan profil.
- Subkueri yang membaca dari tabel lain, atau baris yang berbeda dari tabel yang sama.
Untuk skenario yang kompleks, seperti memindahkan tabel atau transformasi yang memerlukan penggabungan antar-tabel, sebaiknya gunakan konektor Dataflow.
Contoh
Contoh kode berikut mengupdate kolom MarketingBudget
dari tabel Albums
.
C++
Anda menggunakan fungsi ExecutePartitionedDml()
untuk menjalankan pernyataan DML berpartisi.
C#
Anda menggunakan metode ExecutePartitionedUpdateAsync()
untuk menjalankan pernyataan DML berpartisi.
Go
Anda menggunakan metode PartitionedUpdate()
untuk menjalankan pernyataan DML berpartisi.
Java
Anda menggunakan metode executePartitionedUpdate()
untuk menjalankan pernyataan DML berpartisi.
Node.js
Anda menggunakan metode runPartitionedUpdate()
untuk menjalankan pernyataan DML berpartisi.
PHP
Anda menggunakan metode executePartitionedUpdate()
untuk menjalankan pernyataan DML berpartisi.
Python
Anda menggunakan metode execute_partitioned_dml()
untuk menjalankan pernyataan DML berpartisi.
Ruby
Anda menggunakan metode execute_partitioned_update()
untuk menjalankan pernyataan DML berpartisi.
Contoh kode berikut menghapus baris dari tabel Singers
, berdasarkan kolom
SingerId
.
C++
C#
Go
Java
Node.js
PHP
Python
Ruby
Apa langkah selanjutnya?
Pelajari cara mengubah data Menggunakan DML.
Untuk mempelajari perbedaan antara DML dan mutasi, lihat Membandingkan DML dan Mutasi
Pertimbangkan penggunaan konektor Dataflow untuk skenario transformasi data lainnya.