Ottimizzare il rendimento delle query vettoriali

Seleziona una versione della documentazione:

Questo documento descrive come ottimizzare gli indici per ottenere prestazioni delle query più veloci e un migliore recupero in AlloyDB Omni.

Prima di iniziare

Prima di creare un indice ScaNN, completa le seguenti operazioni:

  • Assicurati che sia già stata creata una tabella con i tuoi dati.
  • Per evitare problemi durante la generazione dell'indice, assicurati che il valore impostato per i flag maintenance_work_mem e shared_buffers sia inferiore alla memoria totale della macchina.

Ottimizzare un indice ScaNN

Utilizza le seguenti indicazioni per scegliere tra un indice ScaNN a due livelli e uno a tre livelli:

  • Scegli un indice a due livelli se il numero di righe del vettore è inferiore a 10 milioni.
  • Scegli un indice a tre livelli se il numero di righe del vettore supera i 100 milioni.
  • Scegli un indice a tre livelli per ottimizzare il tempo di creazione dell'indice o un indice a due livelli per ottimizzare il recupero della ricerca se il numero di righe vettoriali è compreso tra 10 milioni e 100 milioni di righe.

Prendi in considerazione i seguenti esempi per gli indici ScaNN a due e tre livelli che mostrano come vengono impostati i parametri di ottimizzazione per una tabella con 1.000.000 di righe:

Indice a due livelli

SET LOCAL scann.num_leaves_to_search = 1;
SET LOCAL scann.pre_reordering_num_neighbors=50;

CREATE INDEX my-scann-index ON my-table
  USING scann (vector_column cosine)
  WITH (num_leaves = [power(1000000, 1/2)]);

Indice a tre livelli

SET LOCAL scann.num_leaves_to_search = 10;
SET LOCAL scann.pre_reordering_num_neighbors=50;

CREATE INDEX my-scann-index ON my-table
  USING scann (vector_column cosine)
  WITH (num_leaves = [power(1000000, 2/3)], max_num_levels = 2);

Analizzare le query

Utilizza il comando EXPLAIN ANALYZE per analizzare gli approfondimenti sulle query come mostrato nella seguente query SQL di esempio.

  EXPLAIN ANALYZE SELECT result-column
  FROM my-table
  ORDER BY EMBEDDING_COLUMN <-> embedding('text-embedding-005', 'What is a database?')::vector
  LIMIT 1;

La risposta di esempio QUERY PLAN include informazioni quali il tempo impiegato, il numero di righe scansionate o restituite e le risorse utilizzate.

Limit  (cost=0.42..15.27 rows=1 width=32) (actual time=0.106..0.132 rows=1 loops=1)
  ->  Index Scan using my-scann-index on my-table  (cost=0.42..858027.93 rows=100000 width=32) (actual time=0.105..0.129 rows=1 loops=1)
        Order By: (embedding_column <-> embedding('text-embedding-005', 'What is a database?')::vector(768))
        Limit value: 1
Planning Time: 0.354 ms
Execution Time: 0.141 ms

Visualizzare le metriche dell'indice vettoriale

Puoi utilizzare le metriche dell'indice vettoriale per esaminare il rendimento dell'indice vettoriale, identificare le aree da migliorare e ottimizzare l'indice in base alle metriche, se necessario.

Per visualizzare tutte le metriche dell'indice vettoriale, esegui la seguente query SQL, che utilizza la vista pg_stat_ann_indexes:

SELECT * FROM pg_stat_ann_indexes;

Per saperne di più sull'elenco completo delle metriche, consulta Metriche dell'indice vettoriale.

Passaggi successivi