Vertex AI-Modelloptimierer

Der Vertex AI Model Optimizer ist ein dynamischer Endpunkt, der die Modellauswahl vereinfacht, indem automatisch das Gemini-Modell angewendet wird, das Ihren Anforderungen am besten entspricht. So können Sie Ihre Prompts auf einen einzelnen Meta-Endpunkt verweisen und der Dienst wählt basierend auf Ihren Kosten- und Qualitätseinstellungen intelligent das am besten geeignete Gemini-Modell für Ihre Suchanfrage aus (Pro, Flash usw.).

Weitere Informationen zu den Preisen für den Modelloptimierer finden Sie unter Preise.

Vorteile

Mit der Modelloptimierung haben Sie folgende Möglichkeiten:

  • Modellauswahl vereinfachen, anstatt für jede Anwendung ein Modell auszuwählen
  • Sie können die Leistung für Kosten, Qualität oder beides optimieren, um Leistung und Budget in Einklang zu bringen.
  • Nahtlose Einbindung in bestehende Gemini APIs und SDKs
  • Nutzung erfassen und Einsparpotenziale ermitteln
  • Textbasierte Aufgaben effizient bearbeiten, ohne dass eine manuelle Endpunktauswahl erforderlich ist

Unterstützte Modelle

  • Gemini 2.0 Flash (GA)
  • Gemini 2.5 Pro (Vorabversion, 25. März)

Sprachunterstützung

Der Modelloptimierer unterstützt alle Sprachen, die auch von den Gemini-Modellen unterstützt werden. (Siehe Gemini-Sprachunterstützung)

Modalität

Der Modelloptimierer unterstützt Textanwendungsfälle, darunter:

  • Programmieren, einschließlich Funktionsaufrufen und Codeausführung
  • Zusammenfassung
  • Unterhaltungen mit einer und mehreren Antworten
  • Frage und Antwort

Informationen zu Einschränkungen und deren Umgang finden Sie unter Nicht unterstützte Funktionen behandeln.

Erste Schritte

Eine Einführung in den Model Optimizer finden Sie in unserem Colab-Notebook für den Schnellstart.

Vertex AI Model Optimizer verwenden

Gen AI SDK for Python

Installieren

pip install --upgrade google-genai

Weitere Informationen finden Sie in der SDK-Referenzdokumentation.

Legen Sie Umgebungsvariablen fest, um das Gen AI SDK mit Vertex AI zu verwenden:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True

from google import genai
from google.genai.types import (
    FeatureSelectionPreference,
    GenerateContentConfig,
    HttpOptions,
    ModelSelectionConfig
)

client = genai.Client(http_options=HttpOptions(api_version="v1beta1"))
response = client.models.generate_content(
    model="model-optimizer-exp-04-09",
    contents="How does AI work?",
    config=GenerateContentConfig(
        model_selection_config=ModelSelectionConfig(
            feature_selection_preference=FeatureSelectionPreference.BALANCED  # Options: PRIORITIZE_QUALITY, BALANCED, PRIORITIZE_COST
        ),
    ),
)
print(response.text)
# Example response:
# Okay, let's break down how AI works. It's a broad field, so I'll focus on the ...
#
# Here's a simplified overview:
# ...

Umgang mit nicht unterstützten Funktionen

Der Modelloptimierer unterstützt nur die Texteingabe und -ausgabe. Die Anfrage kann jedoch verschiedene Modalitäten oder Tools enthalten, die nicht unterstützt werden. In den folgenden Abschnitten wird beschrieben, wie Model Optimizer mit diesen nicht unterstützten Funktionen umgeht.

Multimodale Anfragen

Bei Anfragen mit Prompts mit multimodalen Daten wie Video, Bildern oder Audio wird der Fehler INVALID_ARGUMENT ausgegeben.

Nicht unterstützte Tools

Der Modelloptimierer unterstützt die Funktionsdeklaration nur für Anfragen. Wenn eine Anfrage andere Tooltypen enthält, z. B. google_maps, google_search, enterprise_web_search, retrieval oder browse, wird ein INVALID_ARGUMENT-Fehler ausgegeben.

Feedback geben

Wenn Sie uns Feedback zu Model Optimizer geben möchten, füllen Sie bitte diese Umfrage aus.

Wenn Sie Fragen, technische Probleme oder Feedback zum Modelloptimierer haben, wenden Sie sich an model-optimizer-support@google.com.

Kundenforum

Wenn Sie direkt mit dem Entwicklungsteam in Kontakt treten möchten, können Sie der Vertex AI Model Optimizer Listening Group beitreten. Dort können Sie mehr über das Produkt erfahren und uns dabei helfen, die Funktionen für Sie zu optimieren. Die Gruppe umfasst folgende Aktivitäten:

  • Virtuelle Workshops mit weiteren Informationen zu den Funktionen
  • Feedback-Umfragen zum Mitteilen Ihrer Bedürfnisse und Prioritäten
  • 1:1-Sitzungen mit Google Cloud -Mitarbeitern, während wir neue Funktionen entwickeln

Die Aktivitäten werden etwa alle 6 bis 8 Wochen angeboten. Sie können so viele oder so viele Teilnehmer nehmen, wie Sie möchten, oder Sie können dies jederzeit deaktivieren. Füllen Sie das Anmeldeformular für die Diskussionsgruppe zum Vertex AI Model Optimizer aus, um der Gruppe beizutreten.