In diesem Leitfaden wird beschrieben, wie Sie eine Texteinbettung mit der Vertex AI Text Embeddings API erstellen. Auf dieser Seite werden die folgenden Themen behandelt: Die Vertex AI Text Embeddings API verwendet dichte Vektordarstellungen von Text. Diese Einbettungen werden mit Deep-Learning-Methoden erstellt, die denen von Large Language Models ähneln. Im Gegensatz zu spärlichen Vektoren, bei denen Wörter in der Regel direkt Zahlen zugeordnet werden, sind dichte Vektoren so konzipiert, dass sie die Bedeutung eines Textabschnitts besser darstellen. So können Sie nach Passagen suchen, die der Bedeutung einer Anfrage entsprechen, auch wenn in den Passagen nicht dieselben Wörter verwendet werden. Die wichtigsten Merkmale dieser Einbettungen sind: Weitere Informationen finden Sie in den folgenden Ressourcen: In the Google Cloud console, on the project selector page,
select or create a Google Cloud project.
Enable the Vertex AI API.
In the Google Cloud console, on the project selector page,
select or create a Google Cloud project.
Enable the Vertex AI API.
Sie können Texteinbettungen mit den folgenden Modellen abrufen: Für eine hervorragende Einbettungsqualität ist Verwenden Sie nur die Modellnamen, die in der Tabelle der unterstützten Modelle aufgeführt sind. Geben Sie keinen Modellnamen ohne das Suffix Sie können Texteinbettungen für ein Snippet aus Text mithilfe der Vertex AI API oder dem Vertex AI SDK für Python abrufen. Jede Anfrage ist auf 250 Eingabetexte und insgesamt 20.000 Eingabetokens beschränkt. Wenn eine Anfrage das Tokenlimit überschreitet, wird ein 400-Fehler zurückgegeben. Jeder einzelne Eingabetext ist auf 2.048 Tokens beschränkt. Überschüssige Tokens werden stillschweigend abgeschnitten. Wenn Sie die automatische Kürzung deaktivieren möchten, setzen Sie Weitere Informationen finden Sie unter Limits für Texteinbettungen. Standardmäßig erzeugen alle Modelle einen Embedding-Vektor in voller Länge. Für In den folgenden Beispielen wird das
Weitere Informationen finden Sie in der
SDK-Referenzdokumentation.
Umgebungsvariablen für die Verwendung des Gen AI SDK mit Vertex AI festlegen:
Nachdem Sie die Einbettung generiert haben, können Sie sie einer Vektordatenbank wie der Vektorsuche hinzufügen. Dies ermöglicht einen Abruf mit niedriger Latenz und ist von entscheidender Bedeutung, wenn die Größe Ihrer Daten zunimmt. Weitere Informationen zur Vektorsuche finden Sie unter Vektorsuche – Übersicht.
Hinweise
Unterstützte Modelle
Modellname
Beschreibung
Ausgabeabmessungen
Maximale Sequenzlänge
Unterstützte Textsprachen
gemini-embedding-001
Hervorragende Leistung bei Aufgaben in englischer Sprache, mehrsprachigen Aufgaben und Code-Aufgaben. Es vereint die bisherigen spezialisierten Modelle wie
text-embedding-005
und text-multilingual-embedding-002
und erzielt in den jeweiligen Bereichen eine bessere Leistung. Weitere Informationen finden Sie in unserem technischen Bericht.Bis zu 3.072
2.048 Tokens
Unterstützte Textsprachen
text-embedding-005
Spezialisiert auf Aufgaben in englischer Sprache und Code.
Bis zu 768
2.048 Tokens
Englisch
text-multilingual-embedding-002
Spezialisiert auf mehrsprachige Aufgaben.
Bis zu 768
2.048 Tokens
Unterstützte Textsprachen
gemini-embedding-001
unser großes Modell, das für höchste Leistung entwickelt wurde. gemini-embedding-001
unterstützt eine Instanz pro Anfrage.@version
an und verwenden Sie nicht @latest
, da diese Formate ungültig sind.Texteinbettungen für ein Text-Snippet abrufen
API-Limits
autoTruncate
auf false
.Einbettungsdimension auswählen
gemini-embedding-001
hat dieser Vektor 3.072 Dimensionen, für andere Modelle sind es 768 Dimensionen. Mit dem Parameter output_dimensionality
können Sie die Größe des Ausgabebettungsvektors steuern. Eine kleinere Ausgabedimensionalität kann Speicherplatz sparen und die Recheneffizienz für nachgelagerte Anwendungen steigern, was jedoch mit einem potenziellen Qualitätsverlust einhergehen kann.gemini-embedding-001
-Modell verwendet.Python
Installieren
pip install --upgrade google-genai
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True
Einbettung zu einer Vektordatenbank hinzufügen
Nächste Schritte
text-embedding-005
und text-multilingual-embedding-002
finden Sie im Forschungsartikel Gecko: Versatile Text Embeddings Distillled from Large Language Models.
Texteinbettungen abrufen
Sofern nicht anders angegeben, sind die Inhalte dieser Seite unter der Creative Commons Attribution 4.0 License und Codebeispiele unter der Apache 2.0 License lizenziert. Weitere Informationen finden Sie in den Websiterichtlinien von Google Developers. Java ist eine eingetragene Marke von Oracle und/oder seinen Partnern.
Zuletzt aktualisiert: 2025-08-19 (UTC).