Modelli di AI generativa disponibili

Vertex AI su Google Distributed Cloud (GDC) air-gapped offre un elenco crescente di modelli di AI generativa di base che puoi testare, eseguire il deployment e implementare per le tue applicazioni air-gapped. I modelli di base vengono ottimizzati per casi d'uso specifici e offerti a prezzi diversi. Questa pagina riassume le famiglie di modelli disponibili nelle API Generative AI su GDC e ti guida nella scelta dei modelli in base al caso d'uso.

Modelli di embedding

Gli incorporamenti convertono i dati di testo scritti in linguaggio naturale in vettori numerici. Queste rappresentazioni vettoriali sono progettate per acquisire il significato semantico e il contesto delle parole che rappresentano. I modelli di incorporamento di testo possono generare incorporamenti ottimizzati per vari tipi di attività, come recupero di documenti, domande e risposte, classificazione e verifica dei fatti. Per il testo in inglese, utilizza text-embedding-004. Per il testo multilingue, utilizza text-multilingual-embedding-002.

La seguente tabella riepiloga i modelli disponibili nell'API Embeddings. Per saperne di più sugli incorporamenti, vedi Incorporamenti di testo.

Modello Descrizione Specifiche
Incorporamento di testo

(text-embedding-004)
Restituisce gli incorporamenti per gli input di testo in inglese. Input token massimo: 2048.

Dimensioni di embedding:meno di 768.
Text Embedding Multilingual

(text-multilingual-embedding-002)
Restituisce gli incorporamenti per gli input di testo di oltre 100 lingue. Input token massimo: 2048.

Dimensioni di embedding:meno di 768.