Diese Seite wurde von der Cloud Translation API übersetzt.

Überwachte Feinabstimmung für Gemini-Modelle

Die überwachte Feinabstimmung ist eine gute Option, wenn Sie eine klar definierte Aufgabe mit verfügbaren, mit Labels versehenen Daten haben. Sie ist besonders effektiv bei domainspezifischen Anwendungen, bei denen sich die Sprache oder der Inhalt erheblich von den Daten unterscheiden, mit denen das große Modell ursprünglich trainiert wurde. Sie können die Datentypen Text, Bild, Audio und Dokument abstimmen.

Bei der überwachten Feinabstimmung wird das Modellverhalten mit einem mit Labels versehenen Dataset angepasst. Bei diesem Prozess wird die Gewichtung des Modells angepasst, um den Unterschied zwischen den Vorhersagen und den tatsächlichen Labels zu minimieren. Sie können damit beispielsweise die Modellleistung für die folgenden Arten von Aufgaben verbessern:

Klassifizierung
Zusammenfassung
Extraktives Question Answering
Chat

Eine Erörterung der wichtigsten Anwendungsfälle für die Optimierung finden Sie im Blogpost Hundreds of organizations are fine-tuning Gemini models. Hier sind die beliebtesten Anwendungsfälle.

Weitere Informationen

Unterstützte Modelle

Die folgenden Gemini-Modelle unterstützen die überwachte Feinabstimmung:

Bei Modellen, die Thinking unterstützen, empfehlen wir, das Thinking-Budget auf „Aus“ oder den niedrigsten Wert zu setzen. Dies kann die Leistung verbessern und die Kosten für optimierte Aufgaben senken. Bei der überwachten Feinabstimmung lernt das Modell aus den Trainingsdaten und lässt den Denkprozess aus. Daher kann das resultierende optimierte Modell optimierte Aufgaben effektiv ohne Thinking-Budget ausführen.

Beschränkungen

Gemini 2.5 Flash
Gemini 2.5 Flash-Lite

Spezifikation	Wert
Maximale Anzahl von Eingabe- und Ausgabetrainings-Tokens	131.072
Maximale Anzahl von Eingabe- und Ausgabetokens für die Bereitstellung	Wie beim Basismodell von Gemini
Maximale Größe des Validierungs-Datasets	5.000 Beispiele
Maximale Dateigröße des Trainings-Datasets	1 GB für JSONL
Maximale Größe des Trainings-Datasets	1 Million Nur-Text-Beispiele oder 300.000 multimodale Beispiele
Adaptergröße	Unterstützte Werte sind 1, 2, 4, 8 und 16.

Gemini 2.5 Pro

Spezifikation	Wert
Maximale Anzahl von Eingabe- und Ausgabetrainings-Tokens	131.072
Maximale Anzahl von Eingabe- und Ausgabetokens für die Bereitstellung	Wie beim Basismodell von Gemini
Maximale Größe des Validierungs-Datasets	5.000 Beispiele
Maximale Dateigröße des Trainings-Datasets	1 GB für JSONL
Maximale Größe des Trainings-Datasets	1 Million Nur-Text-Beispiele oder 300.000 multimodale Beispiele
Adaptergröße	Unterstützte Werte sind 1, 2, 4 und 8.

Gemini 2.0 Flash
Gemini 2.0 Flash-Lite

Spezifikation	Wert
Maximale Anzahl von Eingabe- und Ausgabetrainings-Tokens	131.072
Maximale Anzahl von Eingabe- und Ausgabetokens für die Bereitstellung	Wie beim Basismodell von Gemini
Maximale Größe des Validierungs-Datasets	5.000 Beispiele
Maximale Dateigröße des Trainings-Datasets	1 GB für JSONL
Maximale Größe des Trainings-Datasets	1 Million Nur-Text-Beispiele oder 300.000 multimodale Beispiele
Adaptergröße	Unterstützte Werte sind 1, 2, 4 und 8.

Bekannte Probleme

Wenn Sie beim Senden von Inferenzanfragen an optimierte Gemini-Modelle kontrollierte Generierung anwenden, kann dies zu einer geringeren Modellqualität führen, da die Daten während der Optimierung und Inferenz nicht übereinstimmen. Während der Abstimmung wird die kontrollierte Ausgabe nicht angewendet. Das abgestimmte Modell kann daher während der Inferenz nicht gut mit der kontrollierten Ausgabe umgehen. Durch die überwachte Feinabstimmung wird das Modell effektiv angepasst, um strukturierte Ausgaben zu generieren. Daher müssen Sie keine kontrollierte Ausgabe anwenden, wenn Sie Inferenzanfragen für abgestimmte Modelle stellen.

Anwendungsfälle für die Verwendung der überwachten Feinabstimmung

Foundation-Modelle funktionieren gut, wenn die erwartete Ausgabe oder Aufgabe in einem Prompt klar und präzise definiert werden kann und der Prompt konsistent die erwartete Ausgabe erzeugt. Wenn Sie möchten, dass ein Modell bestimmte Nischenthemen oder Besonderheiten lernt, die von den allgemeinen Mustern abweichen, sollten Sie das Modell entsprechend abstimmen. Sie können das Modell zum Beispiel mithilfe der Modellabstimmung Folgendes antrainieren:

Bestimmte Strukturen oder Formate zum Generieren einer Ausgabe.
Spezifisches Verhalten, z. B. wenn eine grobe oder ausführliche Ausgabe bereitgestellt werden soll.
Bestimmte benutzerdefinierte Ausgaben für bestimmte Eingabetypen angeben.

Bei den folgenden Beispielen handelt es sich um Anwendungsfälle, die sich nur schwer mit Eingabeaufforderungen erfassen lassen:

Klassifizierung: Die erwartete Antwort ist ein bestimmtes Wort oder eine bestimmte Wortgruppe.

Prompt: Klassifizieren Sie folgenden Text in eine der folgenden Klassen: [Wirtschaft, Unterhaltung]. Text: Investitionsportfolio diversifizieren

Antwort: Geschäftswelt

Durch Abstimmung des Modells kann verhindert werden, dass das Modell ausführliche Antworten generiert.

Zusammenfassung: Die Zusammenfassung folgt einem bestimmten Format. Es kann beispielsweise vorkommen, dass Sie personenidentifizierbare Informationen aus einer Chatzusammenfassung entfernen müssen.

Prompt: Zusammenfassung: Jessica: Das klingt toll! Wir sehen uns auf dem Times Square! Alexander: Wir sehen uns um 10!

Lösung: #Person1 und #Person2 machen ab, sich um 10:00 Uhr am Times Square zu treffen.

Das Format der Ersetzung der Namen der Sprecher durch #Person1 und #Person2 ist schwierig zu beschreiben. Das Foundation Model erzeugt möglicherweise keine solche Antwort.

Antwort auf Extraktionsfrage: Die Frage bezieht sich auf einen Kontext und die Antwort ist ein Teilstring des Kontexts.

Prompt: Kontext: Es gibt Hinweise dafür, dass es in den letzten 21.000 Jahren durch das Letzteiszeitliche Maximum (LGM) und die folgende Entgletscherung zu deutlichen Veränderungen in der Vegetation des amazonischen Regenwalds kam. Frage: Wofür steht LGM?

Antwort: Letzteiszeitliche Maximum

Die Antwort "Last Glacial Maximum" ist eine spezifische Wortgruppe aus dem Kontext.

Chat: Sie müssen die Modellantwort anpassen, damit sie einer Identität, einer Rolle oder einem Zeichen genügt.

Prompt: Nutzer: Wie ist das Wetter heute?

Antwort: Assistent: Als virtueller Verkäufer der Beispielorganisation kann ich Ihnen nur beim Kauf und beim Versand helfen.

Sie können ein Modell auch in folgenden Situationen optimieren:

Prompts führen nicht konsistent zu den erwarteten Ergebnissen.
Die Aufgabe ist zu kompliziert, um sie in einem Prompt zu definieren. Beispiel: Das Modell soll ein Verhalten klonen, das nur schwer in einem Prompt zu beschreiben ist.
Sie haben komplexe Ahnungen über eine Aufgabe, die schwierig in einem Prompt zu formalisieren ist.
Sie möchten die Beispiele für Schnellerstellungen entfernen, um die Kontextlänge zu reduzieren.

Region für Abstimmungsjob konfigurieren

Nutzerdaten wie das transformierte Dataset und das optimierte Modell werden in der Abstimmungsjobregion gespeichert. Während der Abstimmung kann die Berechnung für verfügbare Beschleuniger auf andere US- oder EU-Regionen übertragen werden. Die Auslagerung ist für Nutzer transparent.

Wenn Sie das Vertex AI SDK verwenden, können Sie die Region bei der Initialisierung angeben. Beispiel:
```
import vertexai
vertexai.init(project='myproject', location='us-central1')
```
Wenn Sie einen überwachten Job zur Feinabstimmung durch Senden einer POST-Anfrage mit der tuningJobs.create-Methode erstellen, verwenden Sie die URL, um die Region anzugeben, in der der Abstimmungsjob ausgeführt wird. In der folgenden URL geben Sie beispielsweise eine Region an, indem Sie beide Instanzen von TUNING_JOB_REGION durch die Region ersetzen, in der der Job ausgeführt wird.
```
 https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs
```
Wenn Sie die Google Cloud -Konsole verwenden, können Sie den Namen der Region im Drop-down-Feld Region auf der Seite Modelldetails auswählen. Dies ist dieselbe Seite, auf der Sie das Basismodell und den Namen eines abgestimmten Modells auswählen.

Abgestimmte Modelle bewerten

Sie können abgestimmte Modelle auf folgende Weise bewerten:

Messwerte für die Optimierung und Validierung: Bewerten Sie das optimierte Modell nach Abschluss des Optimierungsjobs mit Messwerten für die Optimierung und Validierung.
Integrierte Bewertung mit dem Gen AI Evaluation Service (Vorabversion): Konfigurieren Sie Abstimmungsjobs so, dass während der Abstimmung automatisch Bewertungen mit dem Gen AI Evaluation Service ausgeführt werden. Die folgenden Schnittstellen, Modelle und Regionen werden für die Abstimmungsintegration mit dem Gen AI Evaluation Service unterstützt:
- Unterstützte Schnittstellen: Google Gen AI SDK und REST API.
- Unterstützte Modelle: gemini-2.5-pro, gemini-2.5-flash und gemini-2.5-flash-lite.
- Unterstützte Regionen: Eine Liste der unterstützten Regionen finden Sie unter Unterstützte Regionen.

Kontingent

Das Kontingent wird für die Anzahl der gleichzeitig ausgeführten Abstimmungsjobs erzwungen. Jedes Projekt kommt mit einem Standardkontingent zum Ausführen mindestens eines Abstimmungsjobs. Dies ist ein globales Kontingent, das für alle verfügbaren Regionen und unterstützten Modelle gilt. Wenn Sie weitere Jobs gleichzeitig ausführen möchten, müssen Sie für Global concurrent tuning jobs zusätzliche Kontingente anfordern.

Wenn Sie den Gen AI Evaluation Service so konfigurieren, dass Bewertungen während der Optimierung automatisch ausgeführt werden, finden Sie Informationen zu den Kontingenten unter Kontingente für den Gen AI Evaluation Service.

Preise

Die Preise für die überwachte Feinabstimmung von Gemini finden Sie unter Vertex AI-Preise.

Die Anzahl der Trainingstokens wird berechnet, indem die Anzahl der Tokens in Ihrem Trainings-Dataset mit der Anzahl der Epochen multipliziert wird. Nach der Abstimmung fallen aber Inferenzkosten (Vorhersageanfrage) für das feinabgestimmte Modell an. Die Inferenzpreise sind für alle stabilen Versionen von Gemini gleich. Weitere Informationen finden Sie unter Verfügbare stabile Gemini-Modellversionen.

Wenn Sie den Gen AI Evaluation Service so konfigurieren, dass er automatisch während der Abstimmung ausgeführt wird, werden Bewertungen als Batchvorhersagejobs abgerechnet. Weitere Informationen finden Sie unter Preise.