Questa pagina è stata tradotta dall'API Cloud Translation.

Ottenere incorporamenti di testo

Questa pagina descrive come creare un incorporamento di testo utilizzando l'API Text Embedding.

Vertex AI supporta gli incorporamenti di testo in Google Distributed Cloud (GDC) air-gapped tramite l'API Text Embedding. Text Embedding utilizza rappresentazioni vettoriali.

L'embedding di testo converte i dati testuali scritti in qualsiasi lingua supportata in vettori numerici. Queste rappresentazioni vettoriali sono progettate per acquisire il significato semantico e il contesto delle parole che rappresentano. I modelli di incorporamento di testo possono generare incorporamenti ottimizzati per vari tipi di attività, come il recupero di documenti, domande e risposte, classificazione e verifica dei fatti per il testo.

Per saperne di più sui concetti chiave utilizzati dagli incorporamenti di testo, consulta la documentazione seguente:

Per scoprire di più sugli incorporamenti, consulta la panoramica degli incorporamenti di testo.
Per scoprire di più sui modelli di embedding di testo, consulta Modelli di embedding.
Per scoprire in che modo i tipi di attività generano embedding ottimizzati, consulta Scegliere un tipo di attività di embedding.
Per informazioni sulle lingue supportate da ciascun modello di incorporamento, consulta Lingue di incorporamento di testo supportate.

Prima di iniziare

Prima di utilizzare l'incorporamento di testo in un progetto GDC, segui questi passaggi:

Configura un progetto per Vertex AI.
Scegli uno dei modelli disponibili per gli incorporamenti di testo, a seconda della lingua e del tipo di attività.
Abilita l'API Text Embedding o Text Embedding Multilingual, a seconda del modello che vuoi utilizzare.
Concedi a un utente o a un account di servizio l'accesso appropriato a Text Embedding o Text Embedding Multilingual. Per ulteriori informazioni, consulta la seguente documentazione:
- Per informazioni sui ruoli richiesti, vedi Preparare le autorizzazioni IAM.
- Per informazioni sui binding dei ruoli per i service account, vedi Configurare i service account.
Installa le librerie client di Vertex AI.

Importante: devi installare la libreria client Vertex AI Platform per utilizzare Text Embedding e Text Embedding Multilingual.
Ottenere un token di autenticazione.

Devi utilizzare lo stesso progetto per le richieste del modello, il account di servizio e il binding del ruolo IAM.

Ottenere incorporamenti di testo per un frammento di testo

Dopo aver soddisfatto i prerequisiti, puoi utilizzare i modelli Text Embedding o Text Embedding Multilingual per ottenere gli embedding di testo per un frammento di testo utilizzando l'API o l'SDK per Python.

Gli esempi riportati di seguito utilizzano il modello text-embedding-004.

Effettua una richiesta REST all'API Text Embedding. In caso contrario, interagisci con il modello da uno script Python per ottenere un embedding di testo.

REST

Per ottenere gli incorporamenti di testo, invia una richiesta POST specificando l'endpoint del modello.

Per presentare una richiesta:

Salva i contenuti della richiesta in un file JSON denominato request.json. Il file deve essere simile al seguente esempio:

{
  "instances": [
    {
      "content": "What is life?",
      "task_type": "",
      "title": ""
    }
  ]
}

Invia la richiesta utilizzando lo strumento curl:
```
curl -X POST \
-H "Authorization: Bearer TOKEN"\
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://ENDPOINT:443/v1/projects/PROJECT/locations/PROJECT/endpoints/MODEL:predict"
```
Sostituisci quanto segue:
- TOKEN: il token di autenticazione che hai ottenuto.
- ENDPOINT: l'endpoint Text Embedding o Text Embedding Multilingual che utilizzi per la tua organizzazione. Per saperne di più, visualizza lo stato e gli endpoint del servizio.
- PROJECT: il nome del progetto.
- MODEL: il modello che vuoi utilizzare. Di seguito sono riportati i valori disponibili:
  - endpoint-text-embedding per il modello Text Embedding.
  - endpoint-text-embedding-multilingual per il modello Text Embedding Multilingual.

Devi ottenere una risposta JSON simile alla seguente:

{"predictions":[[-0.00668720435,3.20804138e-05,-0.0281705819,-0.00954890903,-0.0818724185,0.0150693133,-0.00677698106, …. ,0.0167487375,-0.0534791686,0.00208711182,0.032938987,-0.01491543]],"deployedModelId":"text-embedding","model":"models/text-embedding/1","modelDisplayName":"text-embedding","modelVersionId":"1"}

Python

Per ottenere gli incorporamenti di testo da uno script Python:

Installa la libreria client di Vertex AI Platform.