Diese Seite wurde von der Cloud Translation API übersetzt.

Texteinbettungen abrufen

In diesem Dokument wird beschrieben, wie Sie eine Texteinbettung mit der Vertex AI Text Embeddings API erstellen.

Die Vertex AI Text Embeddings API verwendet dichte Vektordarstellungen: gemini-embedding-001 verwendet beispielsweise 3.072-dimensionale Vektoren. Für dichte Vektoreinbettungsmodelle werden Deep-Learning-Methoden verwendet, die den von Large Language Models verwendeten Methoden ähneln. Im Gegensatz zu spärlichen Vektoren, bei denen Wörter in der Regel direkt Zahlen zugeordnet werden, sind dichte Vektoren so konzipiert, dass sie die Bedeutung eines Textabschnitts besser darstellen. Der Vorteil der dichten Vektoreinbettungen in der generativen KI besteht darin, dass Sie anstelle der direkten Übereinstimmungen mit Wörtern oder Syntaxen besser nach Passagen suchen können, die der Bedeutung der Abfrage entsprechen, selbst wenn die Abschnitte nicht dieselbe Sprache verwenden.

Die Vektoren werden normalisiert, sodass Sie Kosinus-Ähnlichkeit, Punktprodukt oder euklidische Distanz verwenden können, um dieselben Ähnlichkeitsrankings zu erhalten.

Weitere Informationen zu Einbettungen finden Sie in der Übersicht über Einbettungen-APIs.
Weitere Informationen zu Texteinbettungsmodellen finden Sie unter Texteinbettungen.
Informationen dazu, welche Sprachen die einzelnen Einbettungsmodelle unterstützen, finden Sie unter Unterstützte Textsprachen.

Hinweise

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

Wählen Sie einen Aufgabentyp für Ihren Einbettungsjob aus.

Unterstützte Modelle

Google-Modelle

Sie können Texteinbettungen mit den folgenden Modellen abrufen:

Modellname	Beschreibung	Ausgabeabmessungen	Maximale Sequenzlänge	Unterstützte Textsprachen
`gemini-embedding-001`	Hervorragende Leistung bei Aufgaben in englischer Sprache, mehrsprachigen Aufgaben und Code-Aufgaben. Es vereint die bisherigen spezialisierten Modelle wie `text-embedding-005` und `text-multilingual-embedding-002` und erzielt in den jeweiligen Bereichen eine bessere Leistung. Weitere Informationen finden Sie in unserem technischen Bericht.	Bis zu 3.072	2.048 Tokens	Unterstützte Textsprachen
`text-embedding-005`	Spezialisiert auf Aufgaben in englischer Sprache und Code-Aufgaben.	Bis zu 768	2.048 Tokens	Englisch
`text-multilingual-embedding-002`	Spezialisiert auf mehrsprachige Aufgaben.	Bis zu 768	2.048 Tokens	Unterstützte Textsprachen

Für eine hervorragende Einbettungsqualität ist gemini-embedding-001 unser großes Modell, das für höchste Leistung entwickelt wurde.

Offene Modelle

Sie können Texteinbettungen mit den folgenden Modellen abrufen:

Modellname	Beschreibung	Ausgabedimensionen	Maximale Sequenzlänge	Unterstützte Textsprachen
`multilingual-e5-small`	Teil der E5-Familie von Texteinbettungsmodellen. Die kleine Variante enthält 12 Ebenen.	Bis zu 384	512 Tokens	Unterstützte Sprachen
`multilingual-e5-large`	Teil der E5-Familie von Texteinbettungsmodellen. Die große Variante enthält 24 Ebenen.	Bis zu 1.024	512 Tokens	Unterstützte Sprachen

Weitere Informationen finden Sie auf der Modellkarte für die E5-Familie. Weitere Informationen zu offenen Modellen finden Sie unter Offene Modelle für MaaS.

Texteinbettungen für ein Text-Snippet abrufen

Sie können Texteinbettungen für ein Snippet aus Text mithilfe der Vertex AI API oder dem Vertex AI SDK für Python abrufen.

API-Limits

Für jede Anfrage sind Sie auf 250 Eingabetexte beschränkt. Die API hat ein maximales Eingabetokenlimit von 20.000. Eingaben, die dieses Limit überschreiten, führen zu einem 400-Fehler. Jeder einzelne Eingabetext ist außerdem auf 2.048 Tokens beschränkt. Überschüssiges wird stillschweigend abgeschnitten. Sie können die automatische Kürzung auch deaktivieren, indem Sie autoTruncate auf false setzen.

Weitere Informationen finden Sie unter Limits für Texteinbettungen.

Einbettungsdimension auswählen

Alle Modelle erzeugen standardmäßig einen Embedding-Vektor in voller Länge. Für gemini-embedding-001 hat dieser Vektor 3.072 Dimensionen. Andere Modelle erzeugen 768-dimensionale Vektoren. Mit dem Parameter output_dimensionality können Nutzer jedoch die Größe des Ausgabebettungsvektors steuern. Durch die Auswahl einer kleineren Ausgabedimensionalität kann Speicherplatz gespart und die Recheneffizienz für nachgelagerte Anwendungen gesteigert werden, ohne dass die Qualität wesentlich beeinträchtigt wird.

In den folgenden Beispielen wird das gemini-embedding-001-Modell verwendet.

Python

Installieren

pip install --upgrade google-genai

Weitere Informationen finden Sie in der SDK-Referenzdokumentation.

Umgebungsvariablen für die Verwendung des Gen AI SDK mit Vertex AI festlegen:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True

from google import genai
from google.genai.types import EmbedContentConfig

client = genai.Client()
response = client.models.embed_content(
    model="gemini-embedding-001",
    contents=[
        "How do I get a driver's license/learner's permit?",
        "How long is my driver's license valid for?",
        "Driver's knowledge test study guide",
    ],
    config=EmbedContentConfig(
        task_type="RETRIEVAL_DOCUMENT",  # Optional
        output_dimensionality=3072,  # Optional
        title="Driver's License",  # Optional
    ),
)
print(response)
# Example response:
# embeddings=[ContentEmbedding(values=[-0.06302902102470398, 0.00928034819662571, 0.014716853387653828, -0.028747491538524628, ... ],
# statistics=ContentEmbeddingStatistics(truncated=False, token_count=13.0))]
# metadata=EmbedContentMetadata(billable_character_count=112)

Go

Informationen zum Installieren oder Aktualisieren von Go