Vertex AI Model Optimizer

In diesem Leitfaden erfahren Sie, wie Sie den Vertex AI Model Optimizer verwenden, einen dynamischen Endpunkt, der die Modellauswahl vereinfacht, indem er automatisch das beste Gemini-Modell für Ihre Anforderungen auswählt. In diesem Dokument werden folgende Themen behandelt:

Weitere Informationen zu den Preisen für Model Optimizer finden Sie unter Preise.

Vorteile

Mit Model Optimizer haben Sie folgende Möglichkeiten:

  • Modellauswahl vereinfachen: Sie müssen nicht mehr für jede Anwendung ein bestimmtes Modell auswählen.
  • Kosten und Qualität optimieren: Sie können Leistung und Budget nach Ihren Wünschen in Einklang bringen.
  • Nahtlose Integration: Funktioniert mit vorhandenen Gemini APIs und SDKs.
  • Nutzung im Blick behalten: Sie können die Nutzung im Blick behalten und potenzielle Kosteneinsparungen ermitteln.
  • Textbasierte Aufgaben effizient erledigen: Textbasierte Aufgaben werden ohne manuelle Endpunktauswahl erledigt.

Unterstützte Modelle

Der Model Optimizer leitet Anfragen an die folgenden Modelle weiter:

  • Gemini 2.0 Flash (allgemein verfügbar)
  • Gemini 2.5 Pro (Vorabversion)

Sprachunterstützung

Model Optimizer unterstützt alle Sprachen, die auch von den Gemini-Modellen unterstützt werden. (siehe „Gemini-Sprachunterstützung“)

Unterstützte Anwendungsfälle

Der Model Optimizer unterstützt reine Textanwendungsfälle, darunter:

  • Programmierung, einschließlich Funktionsaufrufen und Codeausführung
  • Zusammenfassung
  • Chats mit einer oder mehreren Antworten
  • Question Answering

Informationen zu Einschränkungen und deren Behandlung finden Sie unter Nicht unterstützte Funktionen behandeln.

Erste Schritte

Colab-Notebook für den schnellen Einstieg

Vertex AI Model Optimizer verwenden

Python

Installieren

pip install --upgrade google-genai

Weitere Informationen finden Sie in der SDK-Referenzdokumentation.

Umgebungsvariablen für die Verwendung des Gen AI SDK mit Vertex AI festlegen:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True

#     from google import genai
#     from google.genai.types import (
#         FeatureSelectionPreference,
#         GenerateContentConfig,
#         HttpOptions,
#         ModelSelectionConfig
#     )
#
#     client = genai.Client(http_options=HttpOptions(api_version="v1beta1"))
#     response = client.models.generate_content(
#         model="model-optimizer-exp-04-09",
#         contents="How does AI work?",
#         config=GenerateContentConfig(
#             model_selection_config=ModelSelectionConfig(
#                 feature_selection_preference=FeatureSelectionPreference.BALANCED  # Options: PRIORITIZE_QUALITY, BALANCED, PRIORITIZE_COST
#             ),
#         ),
#     )
#     print(response.text)
#     # Example response:
#     # Okay, let's break down how AI works. It's a broad field, so I'll focus on the ...
#     #
#     # Here's a simplified overview:
#     # ...

Nicht unterstützte Funktionen verarbeiten

Model Optimizer unterstützt nur Texteingabe und ‑ausgabe. Eine Anfrage kann jedoch verschiedene Modalitäten oder Tools enthalten, die nicht unterstützt werden. In den folgenden Abschnitten wird beschrieben, wie Model Optimizer diese nicht unterstützten Funktionen verarbeitet.

Multimodale Anfragen

Anfragen mit Prompts, die multimodale Daten wie Video, Bilder oder Audio enthalten, führen zu einem INVALID_ARGUMENT-Fehler.

Nicht unterstützte Tools

Model Optimizer unterstützt nur die Funktionsdeklaration für Anfragen. Wenn eine Anfrage andere Tooltypen wie google_maps, google_search, enterprise_web_search, retrieval oder browse enthält, wird ein INVALID_ARGUMENT-Fehler ausgegeben.

Feedback geben

Wenn Sie Feedback zu Model Optimizer geben möchten, füllen Sie bitte unsere Feedbackumfrage aus.

Bei Fragen, technischen Problemen oder Feedback zu Model Optimizer wenden Sie sich an model-optimizer-support@google.com.

Kundendiskussionsgruppe

Treten Sie der Vertex AI Model Optimizer-Lerngruppe bei, um direkt mit dem Entwicklungsteam in Kontakt zu treten. Dort können Sie das Produkt kennenlernen und uns dabei helfen, die Funktionen für Sie zu optimieren. Die Gruppe umfasst folgende Aktivitäten:

  • Virtuelle Workshops mit weiteren Informationen zu den Funktionen.
  • Feedback-Umfragen zum Mitteilen Ihrer Bedürfnisse und Prioritäten.
  • 1:1-Sitzungen mit Google Cloud -Mitarbeitern, während wir neue Funktionen entwickeln.

Die Aktivitäten werden etwa alle 6 bis 8 Wochen angeboten. Sie können so viele oder so wenige Teilnehmer nehmen, wie Sie möchten, oder Sie können dies jederzeit deaktivieren. Wenn Sie der Gruppe beitreten möchten, füllen Sie das Anmeldeformular für die Vertex AI Model Optimizer-Diskussionsgruppe aus.