Halaman ini menjelaskan cara kerja penyimpanan bertingkat di Spanner. Fitur ini didukung di database dialek GoogleSQL dan database dialek PostgreSQL.
Penyimpanan bertingkat Spanner adalah fitur penyimpanan yang dikelola sepenuhnya yang memungkinkan Anda memilih apakah akan menyimpan data di solid-state drive (SSD) atau hard disk drive (HDD). Secara default, saat Anda tidak menggunakan penyimpanan bertingkat, data Anda disimpan di penyimpanan SSD. Bergantung pada seberapa sering Anda menggunakan atau mengakses data, Anda dapat mempertimbangkan untuk menggunakan penyimpanan bertingkat dan menyimpan data di penyimpanan SSD dan HDD.
- Penyimpanan SSD adalah pilihan dengan performa terbaik (kueri per detik lebih tinggi) dan hemat biaya untuk sebagian besar kasus penggunaan. Anda harus menggunakannya untuk menyimpan data aktif dengan throughput tulis dan baca yang tinggi serta data yang memerlukan akses data dengan latensi rendah.
- Penyimpanan HDD terkadang sesuai untuk set data besar yang tidak sensitif terhadap latensi, jarang diakses, atau jika biaya penyimpanan merupakan pertimbangan penting.
Dengan menggunakan penyimpanan bertingkat, Anda dapat memanfaatkan penyimpanan SSD, yang mendukung performa tinggi data aktif, dan penyimpanan HDD, yang mendukung akses data yang jarang dengan biaya lebih rendah.
Pilih antara penyimpanan SSD dan HDD
Tabel berikut mencantumkan perbedaan dan persamaan antara penyimpanan SSD dan HDD. Jika ragu, sebaiknya pilih penyimpanan SSD.
Penyimpanan SSD | Penyimpanan HDD | |
---|---|---|
Kasus penggunaan target | Data yang memerlukan throughput tulis dan baca yang tinggi, serta akses data latensi rendah | Set data besar yang tidak sensitif terhadap latensi atau jarang diakses |
Throughput yang diharapkan per node Konfigurasi regional |
Hingga 22.500 QPS baca Hingga 3.500 QPS tulis |
Hingga 1.500 QPS baca Hingga 3.500 QPS tulis |
Throughput yang diharapkan per node Konfigurasi dual-region dan multi-region |
Hingga 15.000 QPS baca per region Hingga 2.700 QPS tulis |
Hingga 1.000 QPS baca per region Hingga 2.700 QPS tulis |
Operasi yang didukung | Membaca, menulis, memperbarui, dan menghapus | Membaca, menulis, memperbarui, dan menghapus |
Gunakan penulisan yang dioptimalkan untuk throughput guna meningkatkan throughput penulisan di luar angka dalam tabel. Untuk mengetahui informasi selengkapnya, lihat Ringkasan performa.
Manfaat
Penyimpanan bertingkat menawarkan manfaat berikut dengan memungkinkan Anda menggunakan penyimpanan SSD dan HDD:
- Pengurangan total biaya kepemilikan yang signifikan: Penyimpanan HDD memberikan opsi berbiaya lebih rendah untuk set data besar yang tidak sensitif terhadap latensi atau jarang diakses.
- Kemudahan pengelolaan: Menyediakan layanan penjenjangan yang terkelola sepenuhnya tanpa kompleksitas pipeline tambahan dan logika pemisahan.
- Pengalaman yang terpadu dan konsisten: Menyediakan akses data terpadu dan satu set metrik di seluruh data panas dan dingin (dapat diubah)
- Peningkatan performa: Meningkatkan performa kueri dengan mengatur data Anda dalam grup lokalitas yang berbeda, yang menyediakan lokalitas dan isolasi data di seluruh kolom. Data dalam grup lokalitas yang sama disimpan secara fisik berdekatan.
Cara kerja penyimpanan bertingkat
Secara default, saat Anda membuat instance baru, data hanya disimpan di penyimpanan SSD. Demikian pula, data di instance yang ada juga hanya disimpan di penyimpanan SSD.
Jika Anda memilih untuk menggunakan penyimpanan bertingkat untuk menyimpan beberapa data di penyimpanan HDD, Anda harus membuat grup lokalitas, yang digunakan untuk menentukan kebijakan penyimpanan bertingkat untuk data dalam skema Anda. Saat
membuat grup lokalitas, Anda dapat menentukan jenis penyimpanan, baik ssd
maupun
hdd
. Secara opsional, Anda juga dapat menentukan jangka waktu penyimpanan data di penyimpanan SSD sebelum dipindahkan ke penyimpanan HDD. Setelah waktu yang ditentukan berlalu,
Spanner akan memigrasikan data ke penyimpanan HDD selama siklus pemadatan normalnya, yang biasanya terjadi selama tujuh hari sejak waktu yang ditentukan. Kebijakan ini dikenal sebagai kebijakan penyimpanan bertingkat berbasis usia. Saat menggunakan
kebijakan penyimpanan bertingkat berbasis usia, jumlah waktu minimum data harus
disimpan di SSD sebelum dipindahkan ke penyimpanan HDD adalah satu jam.
Setelah menentukan grup lokalitas, saat membuat tabel, Anda dapat menetapkan kebijakan penyimpanan bertingkat di tingkat database, tabel, kolom, atau indeks sekunder. Kebijakan penyimpanan bertingkat menentukan cara dan tempat data disimpan. Untuk mendapatkan petunjuk, lihat Membuat dan mengelola grup lokalitas.
Pencadangan dan pemulihan
Anda dapat mencadangkan dan memulihkan data menggunakan cadangan Spanner.
Cadangan berisi semua informasi skema penyimpanan, termasuk
INFORMATION_SCHEMA.LOCALITY_GROUP_OPTIONS
, yang
menentukan jenis penyimpanan setiap grup lokalitas. Untuk memulihkan cadangan yang berisi grup lokalitas ke instance baru, instance tujuan harus berada di edisi Spanner Enterprise atau Spanner Enterprise Plus.
Data Boost
Anda dapat menggunakan Spanner Data Boost untuk mengakses data di penyimpanan SSD atau HDD. Mengirim kueri data di HDD menggunakan kapasitas beban disk HDD instance, yang merupakan bagian dari kapasitas komputasi Anda.
Indeks penelusuran
Penelusuran teks lengkap dan indeks vektor mewarisi grup lokalitas yang ditetapkan pada objek database.
Kemampuan observasi
Fitur pengamatan berikut tersedia untuk penyimpanan bertingkat.
Metrik Cloud Monitoring
Spanner menyediakan metrik berikut untuk membantu Anda memantau penggunaan dan data penyimpanan bertingkat menggunakan Cloud Monitoring:
spanner.googleapis.com/instance/storage/used_bytes
(Total penyimpanan): Menampilkan total byte data yang disimpan di penyimpanan SSD dan HDD.spanner.googleapis.com/instance/storage/combined/limit_bytes
: Menampilkan batas penyimpanan SSD dan HDD gabungan.spanner.googleapis.com/instance/storage/combined/limit_bytes_per_processing_unit
: Menampilkan batas penyimpanan SSD dan HDD gabungan untuk setiap unit pemrosesan.spanner.googleapis.com/instance/storage/combined/utilization
: Menampilkan penggunaan penyimpanan SSD dan HDD gabungan, dibandingkan dengan batas penyimpanan gabungan.spanner.googleapis.com/instance/disk_load
: Menampilkan penggunaan HDD dalam persentase. Jika instance Anda mencapai beban disk HDD 100%, Anda akan mengalami peningkatan latensi yang signifikan.
Jika Anda memiliki kueri yang ada yang memfilter metrik yang ada menurut
storage_class:ssd
, Anda harus menghapus filter untuk melihat penggunaan HDD.
Untuk mempelajari lebih lanjut cara memantau resource Spanner, lihat Memantau instance dengan insight sistem dan Memantau instance dengan Cloud Monitoring.
Skema informasi
INFORMATION_SCHEMA.LOCALITY_GROUP_OPTIONS
berisi daftar grup lokalitas dan opsi di database Spanner Anda. Informasi ini mencakup informasi untuk grup lokalitas default
. Untuk mengetahui informasi selengkapnya, lihat
locality_group_options
untuk database dialek GoogleSQL
dan locality_group_options
untuk database dialek PostgreSQL.
Tabel statistik bawaan
Tabel statistik bawaan berikut tersedia untuk database yang menggunakan penyimpanan bertingkat:
SPANNER_SYS.TABLE_SIZES_STATS_1HOUR
: Menampilkan penggunaan penyimpanan HDD dan SSD untuk setiap tabel dalam database Anda.SPANNER_SYS.TABLE_SIZES_STATS_PER_LOCALITY_GROUP_1HOUR
: Menampilkan penggunaan penyimpanan HDD dan SSD untuk setiap grup lokalitas di database Anda.
Untuk mengetahui informasi selengkapnya, lihat Statistik ukuran tabel.
Tabel statistik kueri dan statistik baca memiliki kolom berikut yang terkait dengan penyimpanan bertingkat:
AVG_DISK_IO_COST
: Biaya rata-rata kueri ini dalam hal load disk HDD Spanner. Gunakan nilai ini untuk membuat perbandingan biaya I/O HDD relatif antara operasi baca yang Anda jalankan di database. Nilai yang lebih tinggi menunjukkan bahwa Anda menggunakan beban disk HDD yang lebih besar dan kueri Anda mungkin lebih lambat daripada jika dijalankan di SSD. Selain itu, jika beban disk HDD Anda mencapai kapasitas maksimum, performa kueri Anda mungkin akan semakin terpengaruh.
Untuk mengetahui informasi selengkapnya, lihat Statistik kueri dan Statistik baca.
Harga
Tidak ada biaya tambahan untuk menggunakan penyimpanan bertingkat. Anda akan ditagih harga Spanner standar untuk jumlah kapasitas komputasi yang digunakan instance Anda dan jumlah penyimpanan yang digunakan database Anda. Data yang disimpan di SSD dan HDD ditagih sesuai tarif penyimpanan masing-masing. Anda tidak dikenai biaya untuk memindahkan data antara penyimpanan SSD dan HDD. Mengkueri data di HDD menggunakan kapasitas beban disk HDD instance, yang merupakan bagian dari harga kapasitas komputasi Anda. Untuk mengetahui informasi selengkapnya, lihat Harga Spanner.
Langkah berikutnya
- Pelajari grup lokalitas lebih lanjut.
- Pelajari cara membuat dan mengelola grup lokalitas.
- Pelajari lebih lanjut cara mengoptimalkan kueri dengan pushdown predikat stempel waktu.