Vertex AI su Google Distributed Cloud (GDC) air-gapped offre un elenco crescente di modelli di AI generativa di base che puoi testare, eseguire il deployment e implementare per le tue applicazioni air-gapped. I modelli di base vengono ottimizzati per casi d'uso specifici e offerti a prezzi diversi. Questa pagina riassume le famiglie di modelli disponibili nelle API Generative AI su GDC e ti guida nella scelta dei modelli in base al caso d'uso.
Modelli di embedding
Gli incorporamenti convertono i dati di testo scritti in linguaggio naturale in vettori numerici. Queste rappresentazioni vettoriali sono progettate per acquisire il significato
semantico e il contesto delle parole che rappresentano. I modelli di incorporamento di testo possono
generare incorporamenti ottimizzati per vari tipi di attività, come recupero di documenti,
domande e risposte, classificazione e verifica dei fatti. Per
il testo in inglese, utilizza text-embedding-004
. Per il testo multilingue, utilizza
text-multilingual-embedding-002
.
La seguente tabella riepiloga i modelli disponibili nell'API Embeddings. Per saperne di più sugli incorporamenti, vedi Incorporamenti di testo.
Modello | Descrizione | Specifiche |
---|---|---|
Incorporamento di testo ( text-embedding-004 ) |
Restituisce gli incorporamenti per gli input di testo in inglese. | Input token massimo: 2048. Dimensioni di embedding:meno di 768. |
Text Embedding Multilingual ( text-multilingual-embedding-002 ) |
Restituisce gli incorporamenti per gli input di testo di oltre 100 lingue. | Input token massimo: 2048. Dimensioni di embedding:meno di 768. |