Praktik terbaik untuk menyesuaikan indeks ScaNN di AlloyDB untuk PostgreSQL

Parameter yang direkomendasikan untuk indeks ScaNN berbeda-beda, bergantung pada apakah Anda memilih untuk membuat indeks pohon dua tingkat atau tiga tingkat. Halaman ini memberikan rekomendasi tentang cara menyesuaikan parameter indeks AlloyDB untuk PostgreSQL guna mendapatkan keseimbangan yang optimal antara recall dan QPS.

Pembuatan indeks ScaNN

Untuk mengetahui informasi selengkapnya, lihat referensi indeks ScaNN.

Indeks hierarki dua tingkat

Untuk menerapkan rekomendasi yang membantu Anda menemukan nilai optimal num_leaves dan num_leaves_to_search untuk set data Anda, ikuti langkah-langkah yang direkomendasikan berikut:

  1. Untuk membuat indeks ScaNN yang dioptimalkan untuk kasus berikut, tetapkan parameter num_leaves ke nilai berikut, dengan rows adalah jumlah baris dalam tabel yang diindeks:
    • waktu dan kualitas pembuatan indeks yang seimbang menetapkan num_leaves ke sqrt(rows).
    • kualitas menetapkan num_leaves ke rows/100.
  2. Jalankan kueri pengujian, dengan meningkatkan nilai scann.num_of_leaves_to_search, hingga Anda mencapai rentang perolehan target–misalnya, 95%. Untuk mengetahui informasi selengkapnya tentang cara menganalisis kueri, lihat Menganalisis kueri.
  3. Catat rasio antara scann.num_leaves_to_search dan num_leaves yang akan digunakan pada langkah-langkah berikutnya. Rasio ini memberikan perkiraan di sekitar set data yang akan membantu Anda mencapai target perolehan.

    Jika Anda bekerja dengan vektor dimensi tinggi (500 dimensi atau lebih) dan ingin meningkatkan perolehan, coba sesuaikan nilai scann.pre_reordering_num_neighbors. Nilai default ditetapkan ke nilai 500 * K dengan K adalah batas yang Anda tetapkan dalam kueri.
  4. Jika QPS Anda terlalu rendah setelah kueri Anda mencapai perolehan target, ikuti langkah-langkah berikut:
    1. Buat ulang indeks, dengan meningkatkan nilai num_leaves dan scann.num_leaves_to_search sesuai dengan panduan berikut:
      • Tetapkan num_leaves ke faktor yang lebih besar dari akar kuadrat jumlah baris Anda. Misalnya, jika indeks memiliki num_leaves yang ditetapkan ke akar kuadrat jumlah baris, coba tetapkan ke dua kali akar kuadrat. Jika nilai sudah ganda, coba tetapkan ke tiga kali akar kuadrat.
      • Tingkatkan scann.num_leaves_to_search sesuai kebutuhan untuk mempertahankan rasionya dengan num_leaves, yang Anda catat di Langkah 3.
      • Tetapkan num_leaves ke nilai yang kurang dari atau sama dengan jumlah baris dibagi 100.
    2. Jalankan kueri pengujian lagi. Saat Anda menjalankan kueri pengujian, lakukan eksperimen dengan mengurangi scann.num_leaves_to_search, temukan nilai yang meningkatkan QPS sekaligus mempertahankan perolehan yang tinggi. Coba nilai scann.num_leaves_to_search yang berbeda tanpa membangun kembali indeks.
  5. Ulangi Langkah 4 hingga QPS dan rentang perolehan mencapai nilai yang dapat diterima.

Indeks hierarki tiga tingkat

Selain rekomendasi untuk indeks ScaNN pohon dua tingkat, gunakan panduan berikut.

Untuk menerapkan rekomendasi guna menemukan nilai optimal parameter indeks num_leaves dan max_num_levels, ikuti langkah-langkah berikut:

  1. Buat indeks ScaNN dengan kombinasi num_leaves dan max_num_levels berikut berdasarkan sasaran performa Anda:

    • menyeimbangkan waktu & kualitas pembuatan indeks: Tetapkan max_num_levels sebagai 2 dan num_leaves sebagai power(rows, ⅔).
    • Mengoptimalkan kualitas: Tetapkan max_num_levels sebagai 2 dan num_leaves sebagai rows/100.
  2. Jalankan kueri pengujian Anda. Untuk mengetahui informasi selengkapnya tentang menganalisis kueri, lihat Menganalisis kueri.

  3. Catat rasio antara scann.num_leaves_to_search dan num_leaves yang akan digunakan pada langkah-langkah berikutnya. Rasio ini memberikan perkiraan di sekitar set data yang akan membantu Anda mencapai target perolehan.

Jika Anda bekerja dengan vektor dimensi tinggi (500 dimensi atau lebih tinggi) dan ingin meningkatkan perolehan, coba sesuaikan nilai scann.pre_reordering_num_neighbors. Nilai default ditetapkan ke nilai 500 * K dengan K adalah batas yang Anda tetapkan dalam kueri.

  1. Jika QPS Anda terlalu rendah setelah kueri Anda mencapai target perolehan, ikuti langkah-langkah berikut:

    • Buat ulang indeks, dengan meningkatkan nilai num_leaves dan scann.num_leaves_to_search sesuai dengan panduan berikut:
    • Tetapkan num_leaves ke faktor power(rows, ⅔) yang lebih besar. Misalnya, jika indeks memiliki num_leaves yang ditetapkan ke power(rows, ⅔), coba tetapkan ke dua kali lipat power(rows, ⅔). Jika nilainya sudah dua kali lipat, coba tetapkan menjadi tiga kali lipat power(rows, ⅔).
    • Tingkatkan scann.num_leaves_to_search sesuai kebutuhan untuk mempertahankan rasionya dengan num_leaves, yang Anda catat di Langkah 3.
    • Tetapkan num_leaves ke nilai yang kurang dari atau sama dengan rows/100.
    • Jalankan kueri pengujian lagi. Saat Anda menjalankan kueri pengujian, lakukan eksperimen dengan mengurangi scann.num_leaves_to_search, temukan nilai yang meningkatkan QPS sekaligus mempertahankan perolehan yang tinggi. Coba nilai scann.num_leaves_to_search yang berbeda tanpa membangun kembali indeks.
  2. Ulangi Langkah 4 hingga QPS dan rentang perolehan mencapai nilai yang dapat diterima.

Meningkatkan perolehan untuk penelusuran yang difilter

Saat melakukan penelusuran vektor k-nearest neighbor (KNN) yang menyertakan filter, Anda mungkin mengalami situasi saat kueri menampilkan lebih sedikit hasil daripada yang diminta dalam klausa LIMIT. Hal ini dapat menyebabkan apa yang dikenal sebagai recall tidak memadai dan lebih mungkin terjadi saat menggunakan filter yang sangat selektif. Hal ini terjadi karena partisi awal, atau daun, yang ditelusuri ScaNN tidak berisi cukup vektor yang memenuhi kondisi filter.

Untuk mengatasi hal ini, AlloyDB menawarkan fitur yang memungkinkan penelusuran diperluas secara dinamis di luar kumpulan leaf awal untuk menemukan hasil yang cocok.

Cara kerja streaming

Anda dapat mengaktifkan fungsi streaming dengan menyetel parameter scann.satisfy_limit ke relaxed_order. Jika diaktifkan, pemindaian vektor akan terus menelusuri partisi leaf tambahan hingga menemukan hasil yang cukup untuk memenuhi LIMIT kueri Anda, sehingga meningkatkan perolehan.

Untuk mencegah penelusuran berlanjut terlalu lama dan mengontrol dampak performa, Anda dapat menggunakan parameter scann.max_pct_leaves_to_search. Setelan ini berfungsi sebagai pengamanan dengan menetapkan batas atas pada persentase total daun yang dapat dikunjungi kueri. Nilai default untuk ini adalah 15%.

Kapan harus menggunakan streaming

Pertimbangkan untuk menggunakan fitur streaming saat:

  • Anda menggunakan filter dengan penelusuran vektor.
  • Anda mengamati bahwa kueri Anda menampilkan lebih sedikit hasil daripada yang Anda harapkan berdasarkan klausa LIMIT.

Dengan mengaktifkan scann.satisfy_limit, Anda dapat meningkatkan perolehan penelusuran yang difilter. Sebaiknya konfigurasi juga scann.max_pct_leaves_to_search untuk mencapai keseimbangan antara perolehan dan performa kueri.

Pemeliharaan indeks

Jika tabel Anda sering diperbarui atau disisipkan, sebaiknya indeks ulang indeks ScaNN yang ada secara berkala untuk meningkatkan akurasi perolehan. Anda dapat memantau metrik indeks untuk melihat perubahan pada distribusi vektor atau mutasi vektor sejak indeks dibuat, lalu mengindeks ulang sesuai kebutuhan. Untuk mengetahui informasi selengkapnya tentang metrik, lihat Melihat metrik indeks Vektor.

Langkah berikutnya