Esegui una ricerca sulla similarità vettoriale

Questo documento spiega come eseguire ricerche di similarità vettoriale in AlloyDB per PostgreSQL utilizzando l'estensione pgvector. La ricerca di similarità vettoriale, nota anche come ricerca del vicino più prossimo, consente di trovare i punti dati nei tuoi dati più simili a un determinato vettore di query.

Puoi eseguire query sul tuo database AlloyDB per trovare vettori semanticamente simili dopo aver archiviato e indicizzato gli incorporamenti. Utilizza le funzionalità di query pgvector per trovare i vicini più prossimi per un vettore di incorporamento.

Per saperne di più sull'archiviazione degli incorporamenti vettoriali e sulla creazione di un indice, vedi Archivia gli incorporamenti vettoriali e Crea indici rispettivamente.

Per eseguire una ricerca di similarità, specifica la tabella, la colonna di incorporamento, la funzione di distanza, l'incorporamento target e il numero di righe da restituire. Puoi anche utilizzare la funzione embedding() per tradurre il testo in un vettore e poi confrontare il vettore con gli embedding archiviati utilizzando gli operatori pgvector.

Per trovare i vicini semantici più vicini per un vettore di incorporamento, puoi eseguire la seguente query di esempio, in cui imposti la stessa funzione di distanza che hai utilizzato durante la creazione dell'indice.

  SELECT * FROM TABLE
    ORDER BY EMBEDDING_COLUMN DISTANCE_FUNCTION_QUERY ['EMBEDDING']
    LIMIT ROW_COUNT

Sostituisci quanto segue:

  • TABLE: la tabella contenente l'incorporamento a cui confrontare il testo.

  • EMBEDDING_COLUMN: la colonna contenente gli incorporamenti memorizzati.

  • DISTANCE_FUNCTION_QUERY: la funzione di distanza da utilizzare con questa query. Scegli una delle seguenti opzioni in base alla funzione di distanza utilizzata durante la creazione dell'indice:

    • Distanza L2: <->

    • Prodotto interno: <#>

    • Distanza coseno: <=>

  • EMBEDDING: il vettore di embedding di cui vuoi trovare i vicini semantici memorizzati più vicini.

  • ROW_COUNT: il numero di righe da restituire.

    Specifica 1 se vuoi solo la corrispondenza migliore.

Per altri esempi di query, consulta la sezione Query.

Puoi anche utilizzare la funzione embedding() per tradurre il testo in un vettore e per trovare le righe del database con gli incorporamenti più simili dal punto di vista semantico. L'estensione PostgreSQL pgvector è personalizzata per AlloyDB e viene chiamata vector. Applichi il vettore a uno degli operatori di pgvector vicini più prossimi, ad esempio <=> per la distanza del coseno.

Poiché embedding() restituisce un array real, devi eseguire il cast esplicito della chiamata embedding() a vector per utilizzare questi valori con gli operatori pgvector.

  CREATE EXTENSION IF NOT EXISTS vector;

  SELECT * FROM TABLE
    ORDER BY EMBEDDING_COLUMN::vector
    <=> google_ml.embedding('MODEL_IDVERSION_TAG', 'TEXT')
    LIMIT ROW_COUNT

Sostituisci quanto segue:

  • MODEL_ID: l'ID del modello da interrogare.

    Se utilizzi Vertex AI Model Garden, specifica text-embedding-005 come ID modello. Questi sono i modelli basati su cloud che AlloyDB può utilizzare per gli incorporamenti di testo. Per ulteriori informazioni, vedi Incorporamenti di testo.

  • (Facoltativo) VERSION_TAG: il tag della versione del modello per cui eseguire la query. Aggiungi il prefisso @ al tag.

    Se utilizzi uno dei modelli in inglese text-embedding-005 con Vertex AI, specifica uno dei tag di versione, ad esempio text-embedding-005, elencati in Versioni del modello.

    Google consiglia vivamente di specificare sempre il tag della versione. Se non specifichi il tag di versione, AlloyDB utilizza l'ultima versione del modello, il che potrebbe portare a risultati imprevisti.

  • TEXT: il testo da tradurre in un embedding vettoriale.

Per accelerare la ricerca KNN filtrata, puoi utilizzare il motore colonnare AlloyDB. Per saperne di più, consulta Accelerare la ricerca vettoriale filtrata (anteprima) e Configurare il motore colonnare.

Passaggi successivi