Anwendung mit der Gemini API in Vertex AI zu Gemini 2 migrieren

In dieser Anleitung erfahren Sie, wie Sie generative AI-Anwendungen von Gemini 1.x- und PaLM-Modellen zu Gemini 2-Modellen migrieren.

Vorteile der Migration zu Gemini 2

Gemini 2 bietet im Vergleich zu Gemini 1.x- und PaLM-Modellen erhebliche Leistungsverbesserungen sowie neue Funktionen. Außerdem hat jede Modellversion einen eigenen Zeitplan für Support und Verfügbarkeit.

Für die meisten Anwendungen mit generativer KI sollte das Upgrade auf Gemini 2 keine wesentlichen Änderungen an Prompts oder Code erfordern. Bei einigen Anwendungen sind jedoch sofortige Änderungen erforderlich. Diese Änderungen lassen sich nur schwer vorhersagen, ohne den Prompt zuerst durch Gemini 2 zu führen. Daher wird vor der Migration empfohlen, Gemini 2 zu testen.

Erhebliche Codeänderungen sind nur bei bestimmten bahnbrechenden Änderungen oder zur Verwendung neuer Gemini 2-Funktionen erforderlich.

Zu welchem Gemini 2-Modell sollte ich migrieren?

Bei der Auswahl eines Gemini 2-Modells, zu dem Sie migrieren möchten, sollten Sie die für Ihre Anwendung erforderlichen Funktionen sowie die Kosten für diese Funktionen berücksichtigen.

Eine Übersicht über die Modellfunktionen von Gemini 2 finden Sie unter Gemini 2. Eine Übersicht aller Google-Modelle finden Sie unter Google-Modelle.

In der folgenden Tabelle finden Sie einen Vergleich der verfügbaren Gemini-Modelle.

Funktion Gemini 1.5 Pro, Gemini 1.5 Flash Gemini 2.0 Flash Gemini 2.0 Flash-Lite Gemini 2.5 Pro Gemini 2.5 Flash
Eingabemodalitäten Text, Dokumente, Bilder, Video, Audio Text, Dokumente, Bilder, Video, Audio Text, Dokumente, Bilder, Video, Audio Text, Dokumente, Bilder, Video, Audio Text, Dokumente, Bilder, Video, Audio Text, Dokumente, Bilder, Video, Audio
Ausgabemodalitäten Text Text Text Text Text Text
Kontextfenster, Gesamttokenlimit 2.097.152 1.048.576 1.048.576 1.048.576 1.048.576 1.048.576
Länge des Ausgabekontexts 8.192 8.192 8.192 8.192 64.192 64.192
Fundierung mit der Google Suche Ja Ja Ja Nein Ja Ja
Funktionsaufrufe Ja Ja Ja Ja Ja Ja
Codeausführung Nein Nein Ja Nein Ja Ja
Kontext-Caching Ja Ja Ja Nein Ja Ja
Batchvorhersage Ja Ja Ja Ja Ja Ja
Live API Nein Nein Nein Nein Nein Nein
Latenz Leistungsstärkste Kamera in der 1,5-Zoll-Klasse Schnellste Version der 1.5-Familie Schnell und kosteneffizient Schnell und kostengünstig Langsamer als Flash, aber kosteneffizient Schnell und kostengünstig
Optimierung Ja Ja Ja Ja Ja Ja
Empfohlenes SDK Vertex AI SDK Vertex AI SDK Gen AI SDK Gen AI SDK Gen AI SDK Gen AI SDK
Preiseinheiten Zeichen Zeichen Token Token Token Token

Migrationsprozess

In diesem Dokument wird ein achtstufiger Prozess zur Migration Ihrer Anwendung zu Gemini 2 beschrieben. Im folgenden Diagramm sind die einzelnen Schritte dargestellt.

Prozess

Hinweise

Anforderungen an die Modellbewertung und -tests dokumentieren

Code-Upgrades und -Tests

Offlinebewertung

Bewertungsergebnisse auswerten und Gemini 2-Prompts und ‑Hyperparameter optimieren

Lasttests

Onlinebewertung

Produktionsbereitstellung

Modellleistung verbessern

Mit den folgenden Tipps können Sie die Leistung von Gemini 2-Modellen nach Abschluss der Migration maximieren:

  • Prüfen Sie Ihre Systemanleitungen, Prompts und Beispiele für Few-Shot-Lernen auf Inkonsistenzen, Widersprüche oder irrelevante Anleitungen und Beispiele.
  • Testen Sie ein leistungsstärkeres Modell. Wenn Sie beispielsweise Gemini 2.0 Flash-Lite getestet haben, sollten Sie Gemini 2.0 Flash ausprobieren.
  • Prüfen Sie alle automatisierten Bewertungsergebnisse, um sicherzustellen, dass sie mit dem menschlichen Urteil übereinstimmen, insbesondere Ergebnisse, bei denen ein Bewertungsmodell verwendet wird. Die Anleitung für das Bewertungsmodell darf keine Inkonsistenzen oder Unklarheiten enthalten.
  • Eine Möglichkeit, die Anleitung für das Bewertungsmodell zu verbessern, besteht darin, die Anleitung mit mehreren Personen einzeln zu testen und zu prüfen, ob ihre Bewertungen einheitlich sind. Wenn Menschen die Anleitung unterschiedlich interpretieren und unterschiedliche Urteile fällen, sind die Anleitungen für Ihr Bewertungsmodell nicht eindeutig.
  • Feineinstellen des Gemini 2-Modells
  • Prüfen Sie die Bewertungsergebnisse auf Muster, die bestimmte Arten von Fehlern zeigen. Wenn Sie Fehler in verschiedene Modelle, Arten oder Kategorien gruppieren, erhalten Sie gezieltere Bewertungsdaten. So lassen sich Prompts leichter an diese Fehler anpassen.
  • Achten Sie darauf, die verschiedenen Komponenten der generativen KI unabhängig voneinander zu bewerten.
  • Passen Sie die Parameter für die Tokenstichprobenerhebung an.

Hilfe

Wenn Sie Hilfe benötigen, bietet Google Cloud Supportpakete für unterschiedliche Anforderungen, wie etwa Rund-um-die-Uhr-Verfügbarkeit, Telefonsupport und Kontakt mit einem technischen Supportmanager. Weitere Informationen finden Sie im Google Cloud-Support.

Nächste Schritte