In diesem Leitfaden erfahren Sie, wie Sie den Vertex AI Model Optimizer verwenden, einen dynamischen Endpunkt, der die Modellauswahl vereinfacht, indem er automatisch das beste Gemini-Modell für Ihre Anforderungen auswählt. In diesem Dokument werden folgende Themen behandelt:
- Vertex AI Model Optimizer verwenden:Hier finden Sie ein Codebeispiel, das zeigt, wie eine Anfrage an den Optimizer-Endpunkt gesendet wird.
- Nicht unterstützte Funktionen verarbeiten:Hier erfahren Sie, wie der Optimierer Anfragen mit nicht unterstützten Modalitäten oder Tools verarbeitet.
Weitere Informationen zu den Preisen für Model Optimizer finden Sie unter Preise.
Vorteile
Mit Model Optimizer haben Sie folgende Möglichkeiten:
- Modellauswahl vereinfachen: Sie müssen nicht mehr für jede Anwendung ein bestimmtes Modell auswählen.
- Kosten und Qualität optimieren: Sie können Leistung und Budget nach Ihren Wünschen in Einklang bringen.
- Nahtlose Integration: Funktioniert mit vorhandenen Gemini APIs und SDKs.
- Nutzung im Blick behalten: Sie können die Nutzung im Blick behalten und potenzielle Kosteneinsparungen ermitteln.
- Textbasierte Aufgaben effizient erledigen: Textbasierte Aufgaben werden ohne manuelle Endpunktauswahl erledigt.
Unterstützte Modelle
Der Model Optimizer leitet Anfragen an die folgenden Modelle weiter:
- Gemini 2.0 Flash (allgemein verfügbar)
- Gemini 2.5 Pro (Vorabversion)
Sprachunterstützung
Model Optimizer unterstützt alle Sprachen, die auch von den Gemini-Modellen unterstützt werden. (siehe „Gemini-Sprachunterstützung“)
Unterstützte Anwendungsfälle
Der Model Optimizer unterstützt reine Textanwendungsfälle, darunter:
- Programmierung, einschließlich Funktionsaufrufen und Codeausführung
- Zusammenfassung
- Chats mit einer oder mehreren Antworten
- Question Answering
Informationen zu Einschränkungen und deren Behandlung finden Sie unter Nicht unterstützte Funktionen behandeln.
Erste Schritte
Colab-Notebook für den schnellen Einstieg
Vertex AI Model Optimizer verwenden
Python
Installieren
pip install --upgrade google-genai
Weitere Informationen finden Sie in der SDK-Referenzdokumentation.
Umgebungsvariablen für die Verwendung des Gen AI SDK mit Vertex AI festlegen:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Nicht unterstützte Funktionen verarbeiten
Model Optimizer unterstützt nur Texteingabe und ‑ausgabe. Eine Anfrage kann jedoch verschiedene Modalitäten oder Tools enthalten, die nicht unterstützt werden. In den folgenden Abschnitten wird beschrieben, wie Model Optimizer diese nicht unterstützten Funktionen verarbeitet.
Multimodale Anfragen
Anfragen mit Prompts, die multimodale Daten wie Video, Bilder oder Audio enthalten, führen zu einem INVALID_ARGUMENT
-Fehler.
Nicht unterstützte Tools
Model Optimizer unterstützt nur die Funktionsdeklaration für Anfragen. Wenn eine Anfrage andere Tooltypen wie google_maps
, google_search
, enterprise_web_search
, retrieval
oder browse
enthält, wird ein INVALID_ARGUMENT
-Fehler ausgegeben.
Feedback geben
Wenn Sie Feedback zu Model Optimizer geben möchten, füllen Sie bitte unsere Feedbackumfrage aus.
Bei Fragen, technischen Problemen oder Feedback zu Model Optimizer wenden Sie sich an model-optimizer-support@google.com.
Kundendiskussionsgruppe
Treten Sie der Vertex AI Model Optimizer-Lerngruppe bei, um direkt mit dem Entwicklungsteam in Kontakt zu treten. Dort können Sie das Produkt kennenlernen und uns dabei helfen, die Funktionen für Sie zu optimieren. Die Gruppe umfasst folgende Aktivitäten:
- Virtuelle Workshops mit weiteren Informationen zu den Funktionen.
- Feedback-Umfragen zum Mitteilen Ihrer Bedürfnisse und Prioritäten.
- 1:1-Sitzungen mit Google Cloud -Mitarbeitern, während wir neue Funktionen entwickeln.
Die Aktivitäten werden etwa alle 6 bis 8 Wochen angeboten. Sie können so viele oder so wenige Teilnehmer nehmen, wie Sie möchten, oder Sie können dies jederzeit deaktivieren. Wenn Sie der Gruppe beitreten möchten, füllen Sie das Anmeldeformular für die Vertex AI Model Optimizer-Diskussionsgruppe aus.