Auf eigenen Daten fundieren

Auf dieser Seite wird erläutert, wie Sie Antworten anhand Ihrer Daten aus Vertex AI Search fundieren können (Vorabversion).

Gemini auf Basis Ihrer Daten fundieren

Wenn Sie die Retrieval-Augmented Generation (RAG) verwenden möchten, verbinden Sie Ihr Modell mit Ihren Websitedaten oder Dokumentensätzen und verwenden Sie dann die Fundierung mit Vertex AI Search.

Die Fundierung auf Ihren Daten unterstützt maximal zehn Vertex AI Search-Datenquellen und kann mit der Fundierung mit der Google Suche kombiniert werden.

Unterstützte Modelle

In diesem Abschnitt sind die Modelle aufgeführt, die die Grounding-Funktion mit Ihren Daten unterstützen. So erfahren Sie, wie jedes Modell fundierte Antworten generiert:

  1. Probieren Sie ein in dieser Tabelle aufgeführtes Modell in der Google Cloud Console aus.

  2. Klicken Sie auf die Ein/Aus-Schaltfläche Fundierung, um die Fundierung zu aktivieren.

  3. Klicken Sie auf Anpassen. Daraufhin wird der Bereich Fundierung anpassen angezeigt.

  4. Wählen Sie Vertex AI Search aus.

  5. Geben Sie im Abschnitt Fundierung mit Vertex AI Search den Pfad zum Vertex AI-Datenspeicher ein. Wenn Sie keinen Vertex AI-Datenspeicher haben, erstellen Sie einen. Weitere Informationen finden Sie unter Datenspeicher erstellen.

  6. Klicken Sie auf Speichern.

Modell Beschreibung Modell testen
Gemini 1.5 Pro
Nur Texteingabe Gemini 1.5 Pro-Modell testen
Gemini 1.5 Flash
Nur Texteingabe Gemini 1.5 Flash-Modell testen
Gemini 1.0 Pro
Nur Texteingabe Gemini 1.0 Pro-Modell testen
Gemini 2.0 Flash
Text, Code, Bilder, Audio, Video, Video mit Audio, PDF Gemini 2.0 Flash-Modell testen

Vorbereitung

Bevor Sie die Modellausgabe auf Ihren Daten fundieren können, müssen Sie Folgendes tun:

  1. Aktivieren Sie Vertex AI Agent Builder und die API.
  2. Erstellen Sie eine Vertex AI Agent Builder-Datenquelle und ‑Anwendung.

Weitere Informationen finden Sie unter Einführung in Vertex AI Search.

Vertex AI Agent Builder aktivieren

  1. Rufen Sie in der Google Cloud Console die Seite Agent Builder auf.

    Zum Agent Builder

  2. Lesen und akzeptieren Sie die Nutzungsbedingungen und klicken Sie anschließend auf Fortfahren und API aktivieren.

Vertex AI Agent Builder ist am Standort global oder am multiregionalen Standort eu und us verfügbar. Weitere Informationen finden Sie unter Standorte von Vertex AI Agent Builder.

Datenspeicher in Vertex AI Agent Builder erstellen

Wenn Sie einen Datenspeicher in Vertex AI Agent Builder erstellen möchten, können Sie ihn mit Websitedaten oder Dokumenten fundieren.

Website

  1. Öffnen Sie in der Google Cloud Console die Seite Datenspeicher erstellen.

  2. Klicken Sie im Feld Website-Inhalt auf Auswählen.
    Der Bereich Geben Sie die Websites für den Datenspeicher an wird angezeigt.

  3. Wenn das Kästchen Erweiterte Websiteindexierung nicht angeklickt ist, klicken Sie darauf, um die Funktion zu aktivieren.
    Der Bereich Datenspeicher konfigurieren wird angezeigt.

  4. Führen Sie im Abschnitt URL-Muster angeben, die indexiert werden sollen die folgenden Schritte aus:

    • Fügen Sie URLs für Einzuschließende Websites hinzu.
    • Optional: Fügen Sie URLs für Auszuschließende Websites hinzu.
  5. Klicken Sie auf Weiter.

  6. Geben Sie im Bereich Datenspeicher konfigurieren

    1. Wählen Sie einen Wert aus der Liste Speicherort des Datenspeichers aus.
    2. Geben Sie in das Feld Name des Datenspeichers einen Namen ein. Die ID wird generiert. Verwenden Sie diese ID, wenn Sie Ihre fundierten Antworten mit Ihrem Datenspeicher generieren. Weitere Informationen finden Sie unter Begründete Antworten mit Ihrem Datenspeicher generieren.
    3. Klicken Sie auf Erstellen.

Dokumente

  1. Öffnen Sie in der Google Cloud Console die Seite Datenspeicher erstellen.

  2. Klicken Sie im Feld Cloud Storage auf Auswählen.
    Der Bereich Daten aus Cloud Storage importieren wird angezeigt.

  3. Wählen Sie im Abschnitt Unstrukturierte Dokumente (PDF, HTML, TXT usw.) die Option Unstrukturierte Dokumente (PDF, HTML, TXT usw.) aus.

  4. Wählen Sie eine Option für die Synchronisierungshäufigkeit aus.

  5. Wählen Sie die Option Zu importierenden Ordner oder zu importierende Datei auswählen aus und geben Sie den Pfad in das Feld ein.

  6. Klicken Sie auf Weiter.
    Der Bereich Datenspeicher konfigurieren wird angezeigt.

  7. Geben Sie im Bereich Datenspeicher konfigurieren

    1. Wählen Sie einen Wert aus der Liste Speicherort des Datenspeichers aus.
    2. Geben Sie in das Feld Name des Datenspeichers einen Namen ein. Die ID wird generiert.
    3. Wenn Sie Optionen für die Textanalyse und das Segmentieren Ihrer Dokumente auswählen möchten, maximieren Sie den Bereich Dokumentverarbeitungsoptionen. Weitere Informationen zu verschiedenen Parsern finden Sie unter Dokumente parsen.
    4. Klicken Sie auf Erstellen.
  8. Klicken Sie auf Erstellen.

Fundierte Antworten mit Ihrem Datenspeicher generieren

Folgen Sie der nachstehenden Anleitung, um ein Modell mit Ihren eigenen Daten zu fundieren. Es werden maximal 10 Datenspeicher unterstützt.

Wenn Sie Ihre Datenspeicher-ID nicht kennen, gehen Sie so vor:

  1. Rufen Sie in der Google Cloud Console die Seite Vertex AI Agent Builder auf und klicken Sie im Navigationsmenü auf Datenspeicher.

    Zur Seite „Datenspeicher“

  2. Klicken Sie auf den Namen des Datenspeichers.

  3. Rufen Sie auf der Datenseite Ihres Datenspeichers die Datenspeicher-ID ab.

Console

Führen Sie die folgenden Schritte aus, um Ihre Modellausgabe im Vertex AI Agent Builder zu fundieren. Dazu nutzen Sie Vertex AI Studio in der Google Cloud Console:

  1. Rufen Sie in der Google Cloud Console die Seite Vertex AI Studio Freeform auf.

    Zu „Freeform“

  2. Klicken Sie auf die Ein/Aus-Schaltfläche Fundierung, um die Fundierung zu aktivieren.
  3. Klicken Sie auf Anpassen.
    1. Wählen Sie Vertex AI Search als Quelle aus.
    2. Ersetzen Sie in diesem Pfadformat die Projekt-ID und die ID des Datenspeichers:

      projects/project_id/locations/global/collections/default_collection/dataStores/data_store_id.

  4. Klicken Sie auf Speichern.
  5. Geben Sie Ihren Prompt in das Textfeld ein und klicken Sie auf Senden.

Ihre Prompt-Antworten werden in Vertex AI Agent Builder fundiert.

Gen AI SDK for Python

Installieren

pip install --upgrade google-genai
Weitere Informationen finden Sie in der SDK-Referenzdokumentation.

Legen Sie Umgebungsvariablen fest, um das Gen AI SDK mit Vertex AI zu verwenden:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=us-central1
export GOOGLE_GENAI_USE_VERTEXAI=True

from google import genai
from google.genai.types import (
    GenerateContentConfig,
    HttpOptions,
    Retrieval,
    Tool,
    VertexAISearch,
)

client = genai.Client(http_options=HttpOptions(api_version="v1"))

# Load Data Store ID from Vertex AI Search
# datastore = "projects/111111111111/locations/global/collections/default_collection/dataStores/data-store-id"

response = client.models.generate_content(
    model="gemini-2.0-flash-001",
    contents="How do I make an appointment to renew my driver's license?",
    config=GenerateContentConfig(
        tools=[
            # Use Vertex AI Search Tool
            Tool(
                retrieval=Retrieval(
                    vertex_ai_search=VertexAISearch(
                        datastore=datastore,
                    )
                )
            )
        ],
    ),
)

print(response.text)
# Example response:
# 'The process for making an appointment to renew your driver's license varies depending on your location. To provide you with the most accurate instructions...'

REST

Senden Sie zum Testen eines Text-Prompts mit der Vertex AI API eine POST-Anfrage an den Endpunkt des Publisher-Modells.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

  • LOCATION: Die Region, in der die Anfrage verarbeitet werden soll.
  • PROJECT_ID: Ihre Projekt-ID.
  • MODEL_ID: Die Modell-ID des multimodalen Modells.
  • TEXT: Die Textanleitung, die in den Prompt eingefügt werden soll.

HTTP-Methode und URL:

POST https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent

JSON-Text anfordern:

{
  "contents": [{
    "role": "user",
    "parts": [{
      "text": "TEXT"
    }]
  }],
  "tools": [{
    "retrieval": {
      "vertexAiSearch": {
        "datastore": projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID
      }
    }
  }],
  "model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}

Wenn Sie die Anfrage senden möchten, maximieren Sie eine der folgenden Optionen:

Sie sollten eine JSON-Antwort ähnlich wie diese erhalten:

{
  "candidates": [
    {
      "content": {
        "role": "model",
        "parts": [
          {
            "text": "You can make an appointment on the website https://dmv.gov/"
          }
        ]
      },
      "finishReason": "STOP",
      "safetyRatings": [
        "..."
      ],
      "groundingMetadata": {
        "retrievalQueries": [
          "How to make appointment to renew driving license?"
        ],
        "groundingChunks": [
          {
            "retrievedContext": {
              "uri": "https://vertexaisearch.cloud.google.com/grounding-api-redirect/AXiHM.....QTN92V5ePQ==",
              "title": "dmv"
            }
          }
        ],
        "groundingSupport": [
          {
            "segment": {
              "startIndex": 25,
              "endIndex": 147
            },
            "segment_text": "ipsum lorem ...",
            "supportChunkIndices": [1, 2],
            "confidenceScore": [0.9541752, 0.97726375]
          },
          {
            "segment": {
              "startIndex": 294,
              "endIndex": 439
            },
            "segment_text": "ipsum lorem ...",
            "supportChunkIndices": [1],
            "confidenceScore": [0.9541752, 0.9325467]
          }
        ]
      }
    }
  ],
  "usageMetadata": {
    "..."
  }
}

Ihre Antwort verstehen

Wenn Ihr Modell-Prompt mithilfe von Vertex AI Studio oder der API erfolgreich in den Datenspeichern von Vertex AI Search fundiert wird, enthalten die Antworten des Modells Metadaten mit Zitaten und Quelllinks. Wenn die Relevanz der Quelle gering ist oder die Antwort des Modells unvollständige Informationen enthält, werden möglicherweise keine Metadaten bereitgestellt und die Prompt-Antwort ist nicht fundiert.

Nächste Schritte