Vertex AI in Google Distributed Cloud (GDC) Air-Gapped bietet eine wachsende Liste an Foundation Models für generative KI, die Sie für Ihre Air-Gapped-Anwendungen testen, bereitstellen und implementieren können. Foundation Models sind für bestimmte Anwendungsfälle optimiert und werden zu verschiedenen Preisen angeboten. Auf dieser Seite werden die Modellfamilien zusammengefasst, die in den generativen KI-APIs auf GDC verfügbar sind. Außerdem erhalten Sie eine Anleitung zur Auswahl von Modellen für verschiedene Anwendungsfälle.
Einbettungsmodelle
Mit Einbettungen werden Textdaten, die in einer natürlichen Sprache geschrieben sind, in numerische Vektoren umgewandelt. Diese Vektordarstellungen sind so konzipiert, dass die semantische Bedeutung und der Kontext der von ihnen dargestellten Wörter erfasst werden. Mit Text-Embedding-Modellen können optimierte Embeddings für verschiedene Aufgabentypen generiert werden, z. B. für den Dokumentabruf, das Stellen und Beantworten von Fragen, die Klassifizierung und die Faktenprüfung. Verwenden Sie text-embedding-004
für englischen Text. Für mehrsprachigen Text verwenden Sie text-multilingual-embedding-002
.
In der folgenden Tabelle sind die in der Embeddings API verfügbaren Modelle zusammengefasst. Weitere Informationen zu Einbettungen finden Sie unter Texteinbettungen.
Modell | Beschreibung | Spezifikationen |
---|---|---|
Texteinbettung ( text-embedding-004 ) |
Gibt Einbettungen für englische Texteingaben zurück. | Maximale Tokeneingabe:2.048. Einbettungsdimensionen:weniger als 768. |
Texteinbettung, mehrsprachig ( text-multilingual-embedding-002 ) |
Gibt Einbettungen für Texteingaben in über 100 Sprachen zurück. | Maximale Tokeneingabe:2.048. Einbettungsdimensionen:weniger als 768. |