Der Vertex AI Model Optimizer ist ein dynamischer Endpunkt, der die Modellauswahl vereinfacht, indem automatisch das Gemini-Modell angewendet wird, das Ihren Anforderungen am besten entspricht. So können Sie Ihre Prompts auf einen einzelnen Meta-Endpunkt verweisen und der Dienst wählt basierend auf Ihren Kosten- und Qualitätseinstellungen intelligent das am besten geeignete Gemini-Modell für Ihre Suchanfrage aus (Pro, Flash usw.).
Weitere Informationen zu den Preisen für den Modelloptimierer finden Sie unter Preise.
Vorteile
Mit der Modelloptimierung haben Sie folgende Möglichkeiten:
- Modellauswahl vereinfachen, anstatt für jede Anwendung ein Modell auszuwählen
- Sie können die Leistung für Kosten, Qualität oder beides optimieren, um Leistung und Budget in Einklang zu bringen.
- Nahtlose Einbindung in bestehende Gemini APIs und SDKs
- Nutzung erfassen und Einsparpotenziale ermitteln
- Textbasierte Aufgaben effizient bearbeiten, ohne dass eine manuelle Endpunktauswahl erforderlich ist
Unterstützte Modelle
- Gemini 2.0 Flash (GA)
- Gemini 2.5 Pro (Vorabversion, 25. März)
Sprachunterstützung
Der Modelloptimierer unterstützt alle Sprachen, die auch von den Gemini-Modellen unterstützt werden. (Siehe Gemini-Sprachunterstützung)
Modalität
Der Modelloptimierer unterstützt Textanwendungsfälle, darunter:
- Programmieren, einschließlich Funktionsaufrufen und Codeausführung
- Zusammenfassung
- Unterhaltungen mit einer und mehreren Antworten
- Frage und Antwort
Informationen zu Einschränkungen und deren Umgang finden Sie unter Nicht unterstützte Funktionen behandeln.
Erste Schritte
Eine Einführung in den Model Optimizer finden Sie in unserem Colab-Notebook für den Schnellstart.
Vertex AI Model Optimizer verwenden
Gen AI SDK for Python
Installieren
pip install --upgrade google-genai
Weitere Informationen finden Sie in der SDK-Referenzdokumentation.
Legen Sie Umgebungsvariablen fest, um das Gen AI SDK mit Vertex AI zu verwenden:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Umgang mit nicht unterstützten Funktionen
Der Modelloptimierer unterstützt nur die Texteingabe und -ausgabe. Die Anfrage kann jedoch verschiedene Modalitäten oder Tools enthalten, die nicht unterstützt werden. In den folgenden Abschnitten wird beschrieben, wie Model Optimizer mit diesen nicht unterstützten Funktionen umgeht.
Multimodale Anfragen
Bei Anfragen mit Prompts mit multimodalen Daten wie Video, Bildern oder Audio wird der Fehler INVALID_ARGUMENT
ausgegeben.
Nicht unterstützte Tools
Der Modelloptimierer unterstützt die Funktionsdeklaration nur für Anfragen. Wenn eine Anfrage andere Tooltypen enthält, z. B. google_maps
, google_search
, enterprise_web_search
, retrieval
oder browse
, wird ein INVALID_ARGUMENT
-Fehler ausgegeben.
Feedback geben
Wenn Sie uns Feedback zu Model Optimizer geben möchten, füllen Sie bitte diese Umfrage aus.
Wenn Sie Fragen, technische Probleme oder Feedback zum Modelloptimierer haben, wenden Sie sich an model-optimizer-support@google.com.
Kundenforum
Wenn Sie direkt mit dem Entwicklungsteam in Kontakt treten möchten, können Sie der Vertex AI Model Optimizer Listening Group beitreten. Dort können Sie mehr über das Produkt erfahren und uns dabei helfen, die Funktionen für Sie zu optimieren. Die Gruppe umfasst folgende Aktivitäten:
- Virtuelle Workshops mit weiteren Informationen zu den Funktionen
- Feedback-Umfragen zum Mitteilen Ihrer Bedürfnisse und Prioritäten
- 1:1-Sitzungen mit Google Cloud -Mitarbeitern, während wir neue Funktionen entwickeln
Die Aktivitäten werden etwa alle 6 bis 8 Wochen angeboten. Sie können so viele oder so viele Teilnehmer nehmen, wie Sie möchten, oder Sie können dies jederzeit deaktivieren. Füllen Sie das Anmeldeformular für die Diskussionsgruppe zum Vertex AI Model Optimizer aus, um der Gruppe beizutreten.