Diese Seite wurde von der Cloud Translation API übersetzt.

Von der Vertex AI-RAG-Engine unterstützte Modelle

Auf dieser Seite sind Gemini-Modelle, selbst bereitgestellte Modelle und Modelle mit verwalteten APIs in Vertex AI aufgeführt, die die Vertex AI RAG Engine unterstützen.

Gemini-Modelle

Die folgenden Modelle unterstützen die RAG-Engine von Vertex AI:

Abgestimmte Gemini-Modelle werden nicht unterstützt, wenn die Gemini-Modelle die Vertex AI RAG Engine verwenden.

Selbst bereitgestellte Modelle

Die Vertex AI-RAG-Engine unterstützt alle Modelle in Model Garden.

Vertex AI RAG Engine mit selbst bereitgestellten offenen Modellendpunkten verwenden

Ersetzen Sie die im Codebeispiel verwendeten Variablen:

PROJECT_ID: Ihre Projekt-ID.
LOCATION: Die Region, in der Ihre Anfrage verarbeitet werden soll.

ENDPOINT_ID: Ihre Endpunkt-ID.

  # Create a model instance with your self-deployed open model endpoint
  rag_model = GenerativeModel(
      "projects/PROJECT_ID/locations/LOCATION/endpoints/ENDPOINT_ID",
      tools=[rag_retrieval_tool]
  )

Modelle mit verwalteten APIs in Vertex AI

Die Modelle mit verwalteten APIs in Vertex AI, die die Vertex AI-RAG-Engine unterstützen, sind:

Im folgenden Codebeispiel wird gezeigt, wie Sie mit der Gemini GenerateContent API eine generative Modellinstanz erstellen. Die Modell-ID, /publisher/meta/models/llama-3.1-405B-instruct-maas, finden Sie auf der Modellkarte.

Ersetzen Sie die im Codebeispiel verwendeten Variablen:

PROJECT_ID: Ihre Projekt-ID.
LOCATION: Die Region, in der Ihre Anfrage verarbeitet werden soll.

RAG_RETRIEVAL_TOOL: Ihr RAG-Abruftool.

  # Create a model instance with Llama 3.1 MaaS endpoint
  rag_model = GenerativeModel(
      "projects/PROJECT_ID/locations/LOCATION/publisher/meta/models/llama-3.1-405B-instruct-maas",
      tools=RAG_RETRIEVAL_TOOL
  )

Das folgende Codebeispiel zeigt, wie Sie die OpenAI-kompatible ChatCompletions API verwenden, um eine Modellantwort zu generieren.

Ersetzen Sie die im Codebeispiel verwendeten Variablen:

PROJECT_ID: Ihre Projekt-ID.
LOCATION: Die Region, in der Ihre Anfrage verarbeitet werden soll.
MODEL_ID: LLM-Modell für die Inhaltsgenerierung. Beispiel: meta/llama-3.1-405b-instruct-maas.
INPUT_PROMPT: Der Text, der zur Inhaltsgenerierung an das LLM gesendet wird. Verwenden Sie einen Prompt, der für die Dokumente in Vertex AI Search relevant ist.
RAG_CORPUS_ID: Die ID der RAG-Korpusressource.
ROLE: Ihre Rolle.
USER: Ihr Nutzername.

CONTENT: Ihre Inhalte.

  # Generate a response with Llama 3.1 MaaS endpoint
  response = client.chat.completions.create(
      model="MODEL_ID",
      messages=[{"ROLE": "USER", "content": "CONTENT"}],
      extra_body={
          "extra_body": {
              "google": {
                  "vertex_rag_store": {
                      "rag_resources": {
                          "rag_corpus": "RAG_CORPUS_ID"
                      },
                      "similarity_top_k": 10
                  }
              }
          }
      },
  )

Nächste Schritte

Einbettungsmodelle mit der Vertex AI RAG Engine verwenden

Von der Vertex AI-RAG-Engine unterstützte Modelle Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Gemini-Modelle

Selbst bereitgestellte Modelle

Modelle mit verwalteten APIs in Vertex AI

Nächste Schritte

Von der Vertex AI-RAG-Engine unterstützte Modelle