このページは Cloud Translation API によって翻訳されました。

教師ありファインチューニングを使用して Gemini モデルをチューニングする

このドキュメントでは、教師ありファインチューニングを使用して Gemini モデルをチューニングする方法について説明します。

始める前に

始める前に、教師ありファインチューニングデータセットを準備する必要があります。ユースケースに応じて、要件は異なります。

チューニング用のテキストデータセットを準備する: テキストチューニング
チューニング用に画像データセットを準備する: 画像チューニング
チューニング用ドキュメントデータセットを準備する: ドキュメントのチューニング
チューニング用に音声データセットを準備する: 音声チューニング
チューニング用に動画データセットを準備する: 動画チューニング

サポートされているモデル

教師ありチューニングは、次の Gemini モデルでサポートされています。

調整ジョブを作成する

教師ありファインチューニングジョブは、 Google Cloud コンソール、Google Gen AI SDK、Vertex AI SDK for Python、REST API、Colab Enterprise を使用して作成できます。

コンソール

Google Cloud コンソールを使用し、教師ありファインチューニングでテキストモデルをチューニングするには、次のステップを実行します。

Google Cloud コンソールの [Vertex AI] セクションで、[Vertex AI Studio] ページに移動します。

Vertex AI Studio に移動
[チューニング済みモデルを作成] をクリックします。
[モデルの詳細] で、次のように構成します。
1. [チューニング済みモデル名] フィールドに、新しいチューニング済みモデルの名前を入力します（最大 128 文字）。
2. [ベースモデル] フィールドで、[gemini-2.5-flash] を選択します。
3. [リージョン] プルダウンフィールドで、パイプラインチューニングジョブが実行されるリージョンと、チューニングされたモデルがデプロイされるリージョンを選択します。
[チューニング設定] で、次のように構成します。
1. [エポック数] フィールドに、モデルのチューニングで実行するステップ数を入力します。
2. [アダプタサイズ] フィールドに、モデルのチューニングに使用するアダプタサイズを入力します。
3. [学習率の乗数] フィールドに、各イテレーションのステップサイズを入力します。デフォルト値は 1 です。.
省略可: 中間チェックポイントを無効にして最新のチェックポイントのみを使用するには、[最後のチェックポイントのみをエクスポート] 切り替えをクリックします。
[続行] をクリックします。

[チューニング用データセット] ページが開きます。
データセットファイルをアップロードするには、次のいずれかを選択します。
1. まだデータセットをアップロードしていない場合は、[ファイルを Cloud Storage にアップロード] のラジオボタンを選択します。
2. [JSONL ファイルの選択] フィールドで [参照] をクリックし、データセットファイルを選択します。
3. [データセットの場所] で [参照] をクリックし、データセットファイルを保存する Cloud Storage バケットを選択します。
4. データセットファイルがすでに Cloud Storage バケットにある場合は、[Cloud Storage 上の既存ファイル] のラジオボタンを選択します。
5. [Cloud Storage のファイルパス] フィールドで [参照] をクリックし、データセットファイルがある Cloud Storage バケットを選択します。
（省略可）トレーニング中に検証指標を取得するには、[モデル検証を有効にする] 切り替えボタンをクリックします。
1. [検証データセット] に、検証データセットの Cloud Storage パスを入力します。
[チューニングを開始] をクリックします。

新しいモデルは、[チューニングと抽出] ページの [Gemini Pro チューニング済みモデル] セクションに表示されます。モデルのチューニングが完了すると、[ステータス] に「成功」と表示されます。

Google Gen AI SDK

import time

from google import genai
from google.genai.types import HttpOptions, CreateTuningJobConfig, TuningDataset, EvaluationConfig, OutputConfig, GcsDestination, Metric

# TODO(developer): Update and un-comment below line
# output_gcs_uri = "gs://your-bucket/your-prefix"

client = genai.Client(http_options=HttpOptions(api_version="v1beta1"))

training_dataset = TuningDataset(
    gcs_uri="gs://cloud-samples-data/ai-platform/generative_ai/gemini/text/sft_train_data.jsonl",
)
validation_dataset = TuningDataset(
    gcs_uri="gs://cloud-samples-data/ai-platform/generative_ai/gemini/text/sft_validation_data.jsonl",
)

evaluation_config = EvaluationConfig(
    metrics=[
        Metric(
            name="FLUENCY",
            prompt_template="""Evaluate this {prediction}"""
        )
    ],
    output_config=OutputConfig(
        gcs_destination=GcsDestination(
            output_uri_prefix=output_gcs_uri,
        )
    ),
)

tuning_job = client.tunings.tune(
    base_model="gemini-2.5-flash",
    training_dataset=training_dataset,
    config=CreateTuningJobConfig(
        tuned_model_display_name="Example tuning job",
        validation_dataset=validation_dataset,
        evaluation_config=evaluation_config,
    ),
)

running_states = set([
    "JOB_STATE_PENDING",
    "JOB_STATE_RUNNING",
])

while tuning_job.state in running_states:
    print(tuning_job.state)
    tuning_job = client.tunings.get(name=tuning_job.name)
    time.sleep(60)

print(tuning_job.tuned_model.model)
print(tuning_job.tuned_model.endpoint)
print(tuning_job.experiment)
# Example response:
# projects/123456789012/locations/us-central1/models/1234567890@1
# projects/123456789012/locations/us-central1/endpoints/123456789012345
# projects/123456789012/locations/us-central1/metadataStores/default/contexts/tuning-experiment-2025010112345678

if tuning_job.tuned_model.checkpoints:
    for i, checkpoint in enumerate(tuning_job.tuned_model.checkpoints):
        print(f"Checkpoint {i + 1}: ", checkpoint)
    # Example response:
    # Checkpoint 1:  checkpoint_id='1' epoch=1 step=10 endpoint='projects/123456789012/locations/us-central1/endpoints/123456789000000'
    # Checkpoint 2:  checkpoint_id='2' epoch=2 step=20 endpoint='projects/123456789012/locations/us-central1/endpoints/123456789012345'

Vertex AI SDK for Python


import time

import vertexai
from vertexai.tuning import sft

# TODO(developer): Update and un-comment below line
# PROJECT_ID = "your-project-id"
vertexai.init(project=PROJECT_ID, location="us-central1")

sft_tuning_job = sft.train(
    source_model="gemini-2.0-flash-001",
    # 1.5 and 2.0 models use the same JSONL format
    train_dataset="gs://cloud-samples-data/ai-platform/generative_ai/gemini-1_5/text/sft_train_data.jsonl",
)

# Polling for job completion
while not sft_tuning_job.has_ended:
    time.sleep(60)
    sft_tuning_job.refresh()

print(sft_tuning_job.tuned_model_name)
print(sft_tuning_job.tuned_model_endpoint_name)
print(sft_tuning_job.experiment)
# Example response:
# projects/123456789012/locations/us-central1/models/1234567890@1
# projects/123456789012/locations/us-central1/endpoints/123456789012345
# <google.cloud.aiplatform.metadata.experiment_resources.Experiment object at 0x7b5b4ae07af0>

REST

モデルのチューニングジョブを作成するには、tuningJobs.create メソッドを使用して POST リクエストを送信します。一部のパラメータは、すべてのモデルでサポートされているわけではありません。チューニングするモデルに適用可能なパラメータのみを含めるようにしてください。

（省略可）（プレビュー）チューニングジョブの完了後に Gen AI Evaluation Service を使用して評価を自動的に実行するには、evaluationConfig を含めます。この評価構成は us-central1 リージョンで使用できます。

リクエストのデータを使用する前に、次のように置き換えます。

PROJECT_ID: 実際のプロジェクト ID。
TUNING_JOB_REGION: チューニングジョブを実行するリージョン。これは、チューニング済みのモデルをアップロードするデフォルトのリージョンでもあります。
BASE_MODEL: チューニングする基盤モデルの名前。
TRAINING_DATASET_URI: トレーニングデータセットの Cloud Storage URI。データセットは JSONL ファイル形式でなければなりません。最適な結果を得るには、少なくとも 100～500 個のサンプルを含めます。詳細については、教師ありチューニングデータセットについてをご覧ください。
VALIDATION_DATASET_URI: 省略可。検証データセットファイルの Cloud Storage URI。
EPOCH_COUNT: 省略可。トレーニング中にモデルがトレーニングデータセット全体に対して行った完全なパスの数。事前入力された推奨値を使用する場合は、未設定のままにします。
ADAPTER_SIZE省略可: チューニングジョブに使用するアダプタのサイズ。チューニングジョブのアダプタのサイズは、トレーニング可能なパラメータの数に影響します。アダプタサイズが大きいほど、モデルはより複雑なタスクを学習できますが、より大きなトレーニングデータセットと長いトレーニング時間が必要になります。
LEARNING_RATE_MULTIPLIER: 省略可。推奨学習率に適用する乗数。推奨値を使用する場合は、未設定のままにします。
EXPORT_LAST_CHECKPOINT_ONLY: 省略可: 最新のチェックポイントのみを使用する場合は、true に設定します。
METRIC_SPEC: 省略可: Gen AI Evaluation Service を使用して評価を実行するために使用する 1 つ以上の指標仕様。指標仕様として、"pointwise_metric_spec"、"pairwise_metric_spec"、"exact_match_spec"、"bleu_spec"、"rouge_spec" を使用できます。
METRIC_SPEC_FIELD_NAME: 省略可: 選択した指標仕様に必要なフィールド。例: "metric_prompt_template"
METRIC_SPEC_FIELD_NAME_CONTENT: 省略可: 選択した指標仕様のフィールドコンテンツ。たとえば、ポイントワイズ評価には "Evaluate the fluency of this sentence: {response}. Give score from 0 to 1. 0 - not fluent at all. 1 - very fluent." のようなフィールドコンテンツを使用できます。
CLOUD_STORAGE_BUCKET: 省略可: Gen AI Evaluation Service によって実行された評価の結果を保存する Cloud Storage バケット。
TUNED_MODEL_DISPLAYNAME: 省略可。チューニングされたモデルの表示名。設定されていない場合は、ランダムな名前が生成されます。
KMS_KEY_NAME: 省略可。リソースの保護に使用される顧客管理の暗号鍵の Cloud KMS リソース ID。キーの形式は projects/my-project/locations/my-region/keyRings/my-kr/cryptoKeys/my-key です。鍵は、コンピューティングリソースが作成されているのと同じリージョンに存在する必要があります。詳細については、顧客管理の暗号鍵（CMEK）をご覧ください。
SERVICE_ACCOUNT: 省略可。チューニングジョブワークロードが実行されるサービスアカウント。指定しない場合、プロジェクト内の Vertex AI セキュアファインチューニングサービスエージェントが使用されます。チューニングサービスエージェントをご覧ください。顧客管理のサービスアカウントを使用する場合は、サービスアカウントに roles/aiplatform.tuningServiceAgent ロールを付与する必要があります。また、顧客管理のサービスアカウントにチューニングサービスエージェント roles/iam.serviceAccountTokenCreator ロールを付与します。

HTTP メソッドと URL:

POST https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs

リクエストの本文（JSON）:

{
  "baseModel": "BASE_MODEL",
  "supervisedTuningSpec" : {
      "trainingDatasetUri": "TRAINING_DATASET_URI",
      "validationDatasetUri": "VALIDATION_DATASET_URI",
      "hyperParameters": {
          "epochCount": "EPOCH_COUNT",
          "adapterSize": "ADAPTER_SIZE",
          "learningRateMultiplier": "LEARNING_RATE_MULTIPLIER"
      },
      "exportLastCheckpointOnly": EXPORT_LAST_CHECKPOINT_ONLY,
      "evaluationConfig": {
          "metrics": [
              {
                  "aggregation_metrics": ["AVERAGE", "STANDARD_DEVIATION"],
                  "METRIC_SPEC": {
                      "METRIC_SPEC_FIELD_NAME":
                          METRIC_SPEC_FIELD_CONTENT
                  }
              },
          ],
          "outputConfig": {
              "gcs_destination": {
                  "output_uri_prefix": "CLOUD_STORAGE_BUCKET"
              }
          },
      },
  },
  "tunedModelDisplayName": "TUNED_MODEL_DISPLAYNAME",
  "encryptionSpec": {
    "kmsKeyName": "KMS_KEY_NAME"
  },
  "serviceAccount": "SERVICE_ACCOUNT"
}

リクエストを送信するには、次のいずれかのオプションを選択します。

curl

注: 次のコマンドは、gcloud init または gcloud auth login を実行して、ユーザーアカウントで gcloud CLI にログインしているか、Cloud Shell を使用して自動的に gcloud CLI にログインしていることを前提としています。gcloud auth list を実行すると、現在アクティブなアカウントを確認できます。

リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs"

PowerShell

注: 次のコマンドは、gcloud init または gcloud auth login を実行して、ご自分のユーザーアカウントで gcloud CLI にログインしていることを前提としています。gcloud auth list を実行すると、現在アクティブなアカウントを確認できます。

リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs" | Select-Object -Expand Content

次のような JSON レスポンスが返されます。

レスポンス

{
  "name": "projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs/TUNING_JOB_ID",
  "createTime": CREATE_TIME,
  "updateTime": UPDATE_TIME,
  "status": "STATUS",
  "supervisedTuningSpec": {
        "trainingDatasetUri": "TRAINING_DATASET_URI",
        "validationDatasetUri": "VALIDATION_DATASET_URI",
        "hyperParameters": {
            "epochCount": EPOCH_COUNT,
            "adapterSize": "ADAPTER_SIZE",
            "learningRateMultiplier": LEARNING_RATE_MULTIPLIER
        },
    },
  "tunedModelDisplayName": "TUNED_MODEL_DISPLAYNAME",
  "encryptionSpec": {
    "kmsKeyName": "KMS_KEY_NAME"
  },
  "serviceAccount": "SERVICE_ACCOUNT"
}

curl コマンドの例

PROJECT_ID=myproject
LOCATION=global
curl \
-X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
"https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/tuningJobs" \
-d \
$'{
   "baseModel": "gemini-2.5-flash",
   "supervisedTuningSpec" : {
      "training_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini/text/sft_train_data.jsonl",
      "validation_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini/text/sft_validation_data.jsonl"
   },
   "tunedModelDisplayName": "tuned_gemini"
}'

Colab Enterprise

Vertex AI でモデルチューニングジョブを作成するには、Colab Enterprise のサイドパネルを使用します。サイドパネルで、関連するコードスニペットをノートブックに追加します。次に、コードスニペットを修正して実行し、チューニングジョブを作成します。Vertex AI でのチューニングジョブでサイドパネルを使用する方法の詳細については、Vertex AI を操作してモデルをチューニングするをご覧ください。

Google Cloud コンソールで、Colab Enterprise の [マイノートブック] ページに移動します。

[マイノートブック] に移動
[リージョン] メニューで、ノートブックを含むリージョンを選択します。
開きたいノートブックをクリックします。ノートブックをまだ作成していない場合は、ノートブックを作成します。
ノートブックの右側のサイドパネルで、 [チューニング] ボタンをクリックします。

サイドパネルで [チューニング] タブが開きます。
[Gemini モデルをチューニングする] ボタンをクリックします。

Colab Enterprise により、Gemini モデルをチューニングするためのコードセルがノートブックに追加されます。
ノートブックで、パラメータ値を格納するコードセルを探します。これらのパラメータを使用して Vertex AI を操作します。
次のパラメータの値を更新します。
- PROJECT_ID: ノートブックが含まれるプロジェクトの ID。
- REGION: ノートブックが配置されているリージョン。
- TUNED_MODEL_DISPLAY_NAME: チューニング済みモデルの名前。
次のコードセルのモデルチューニングパラメータを更新します。
- source_model: 使用する Gemini モデル（例: gemini-2.0-flash-001）。
- train_dataset: トレーニングデータセットの URL。
- validation_dataset: 検証データセットの URL。
- 必要に応じて、残りのパラメータを調整します。
サイドパネルからノートブックに追加されたコードセルを実行します。
最後のコードセルが実行されたら、表示された [チューニングジョブを表示] ボタンをクリックします。
サイドパネルには、モデルチューニングジョブに関する情報が表示されます。
- 指標の準備が整うと、[モニタリング] タブにチューニング指標が表示されます。
- [データセット] タブには、データセットが処理された後、データセットに関するサマリーと指標が表示されます。
- [詳細] タブには、チューニング方法や使用したベースモデル（ソースモデル）など、チューニングジョブに関する情報が表示されます。
チューニングジョブが完了したら、[チューニングの詳細] タブから直接、モデルをテストできるページに移動できます。[テスト] をクリックします。

Google Cloud コンソールで Vertex AI の [テキストチャット] ページが開きます。ここでモデルをテストできます。

ハイパーパラメータの調整

最初のチューニングジョブは、ハイパーパラメータを変更せずに送信することをおすすめします。デフォルト値はモデル出力の品質を最大限に高めることが期待される、ベンチマークの結果に基づく推奨値です。

エポック: トレーニング中にモデルがトレーニングデータセット全体に対して行う完全なパスの数。Vertex AI では、トレーニングデータセットのサイズに合わせてデフォルト値が自動的に調整されます。この値は、モデル出力の品質を最適化するために、ベンチマークの結果に基づきます。
アダプタのサイズ: チューニングジョブに使用するアダプタのサイズ。アダプタのサイズは、チューニングジョブのトレーニング可能なパラメータの数に影響します。アダプタサイズが大きいほど、モデルはより複雑なタスクを学習できますが、より大きなトレーニングデータセットと長いトレーニング時間が必要になります。
学習率の乗数: 推奨学習率に適用する乗数。この値を増やすと収束が早まり、値を減らすと過学習を回避できます。

教師ありファインチューニングのベストプラクティスについては、ブログ投稿「Gemini の教師ありファインチューニング: ベストプラクティスガイド」をご覧ください。

チューニングジョブのリストを表示する

現在のプロジェクトのチューニングジョブのリストを表示するには、Google Cloud コンソール、Google Gen AI SDK、Vertex AI SDK for Python を使用するか、tuningJobs メソッドを使用して GET リクエストを送信します。

コンソール

Google Cloud コンソールでチューニングジョブを表示するには、[Vertex AI Studio] ページに移動します。

Vertex AI Studio に移動

Gemini チューニングジョブは、[Gemini Pro チューニング済みモデル] セクションの表に表示されます。

Google Gen AI SDK

from google import genai
from google.genai.types import HttpOptions

client = genai.Client(http_options=HttpOptions(api_version="v1"))

responses = client.tunings.list()
for response in responses:
    print(response.name)
    # Example response:
    # projects/123456789012/locations/us-central1/tuningJobs/123456789012345

Vertex AI SDK for Python

import vertexai
from vertexai.tuning import sft

# TODO(developer): Update and un-comment below line
# PROJECT_ID = "your-project-id"
vertexai.init(project=PROJECT_ID, location="us-central1")

responses = sft.SupervisedTuningJob.list()

for response in responses:
    print(response)
# Example response:
# <vertexai.tuning._supervised_tuning.SupervisedTuningJob object at 0x7c85287b2680>
# resource name: projects/12345678/locations/us-central1/tuningJobs/123456789012345

REST

モデルのチューニングジョブのリストを表示するには、tuningJobs.list メソッドを使用して GET リクエストを送信します。

リクエストのデータを使用する前に、次のように置き換えます。

PROJECT_ID:
TUNING_JOB_REGION: チューニングジョブを実行するリージョン。これは、チューニング済みのモデルをアップロードするデフォルトのリージョンでもあります。

HTTP メソッドと URL:

GET https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs

リクエストを送信するには、次のいずれかのオプションを選択します。

curl

次のコマンドを実行します。

curl -X GET \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     "https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs"

PowerShell

次のコマンドを実行します。

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method GET `
    -Headers $headers `
    -Uri "https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs" | Select-Object -Expand Content

次のような JSON レスポンスが返されます。

レスポンス

{
  "tuning_jobs": [
    TUNING_JOB_1, TUNING_JOB_2, ...
  ]
}

チューニングジョブの詳細を取得する

現在のプロジェクトのチューニングジョブの詳細を取得するには、Google Cloud コンソール、Google Gen AI SDK、Vertex AI SDK for Python を使用するか、tuningJobs メソッドを使用して GET リクエストを送信します。

コンソール

チューニング済みモデルの詳細を Google Cloud コンソールで表示するには、[Vertex AI Studio] ページに移動します。

Vertex AI Studio に移動
[Gemini Pro チューニング済みモデル] の表でモデルを見つけて、[詳細] をクリックします。

モデルの詳細が表示されます。

Google Gen AI SDK

from google import genai
from google.genai.types import HttpOptions

client = genai.Client(http_options=HttpOptions(api_version="v1"))

# Get the tuning job and the tuned model.
# Eg. tuning_job_name = "projects/123456789012/locations/us-central1/tuningJobs/123456789012345"
tuning_job = client.tunings.get(name=tuning_job_name)

print(tuning_job.tuned_model.model)
print(tuning_job.tuned_model.endpoint)
print(tuning_job.experiment)
# Example response:
# projects/123456789012/locations/us-central1/models/1234567890@1
# projects/123456789012/locations/us-central1/endpoints/123456789012345
# projects/123456789012/locations/us-central1/metadataStores/default/contexts/tuning-experiment-2025010112345678

Vertex AI SDK for Python

import vertexai
from vertexai.tuning import sft

# TODO(developer): Update and un-comment below lines
# PROJECT_ID = "your-project-id"
# LOCATION = "us-central1"
vertexai.init(project=PROJECT_ID, location=LOCATION)

tuning_job_id = "4982013113894174720"
response = sft.SupervisedTuningJob(
    f"projects/{PROJECT_ID}/locations/{LOCATION}/tuningJobs/{tuning_job_id}"
)

print(response)
# Example response:
# <vertexai.tuning._supervised_tuning.SupervisedTuningJob object at 0x7cc4bb20baf0>
# resource name: projects/1234567890/locations/us-central1/tuningJobs/4982013113894174720

REST

モデルのチューニングジョブのリストを表示するには、tuningJobs.get メソッドを使用して GET リクエストを送信し、TuningJob_ID を指定します。

リクエストのデータを使用する前に、次のように置き換えます。

PROJECT_ID:
TUNING_JOB_REGION: チューニングジョブを実行するリージョン。これは、チューニング済みのモデルをアップロードするデフォルトのリージョンでもあります。
TUNING_JOB_ID: チューニングジョブの ID。

HTTP メソッドと URL:

GET https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs/TUNING_JOB_ID

リクエストを送信するには、次のいずれかのオプションを選択します。

curl

次のコマンドを実行します。

curl -X GET \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     "https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs/TUNING_JOB_ID"

PowerShell

次のコマンドを実行します。

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method GET `
    -Headers $headers `
    -Uri "https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs/TUNING_JOB_ID" | Select-Object -Expand Content

次のような JSON レスポンスが返されます。

レスポンス

{
  "name": "projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs/TUNING_JOB_ID",
  "tunedModelDisplayName": "TUNED_MODEL_DISPLAYNAME",
  "createTime": CREATE_TIME,
  "endTime": END_TIME,
  "tunedModel": {
      "model": "projects/PROJECT_ID/locations/TUNING_JOB_REGION/models/MODEL_ID",
      "endpoint": "projects/PROJECT_ID/locations/TUNING_JOB_REGION/endpoints/ENDPOINT_ID"
  },
  "experiment": "projects/PROJECT_ID/locations/TUNING_JOB_REGION/metadataStores/default/contexts/EXPERIMENT_ID",
  "tuning_data_statistics": {
      "supervisedTuningDataStats": {
          "tuninDatasetExampleCount": "TUNING_DATASET_EXAMPLE_COUNT",
          "totalBillableTokenCount": "TOTAL_BILLABLE_TOKEN_COUNT",
          "tuningStepCount": "TUNING_STEP_COUNT"
      }
  },
  "status": "STATUS",
  "supervisedTuningSpec" : {
        "trainingDatasetUri": "TRAINING_DATASET_URI",
        "validationDataset_uri": "VALIDATION_DATASET_URI",
        "hyperParameters": {
            "epochCount": EPOCH_COUNT,
            "learningRateMultiplier": LEARNING_RATE_MULTIPLIER
        }
    }
}

チューニングジョブをキャンセルする

現在のプロジェクトのチューニングジョブをキャンセルするには、 Google Cloud コンソールまたは Vertex AI SDK for Python を使用するか、tuningJobs メソッドを使用して POST リクエストを送信します。

REST

モデルのチューニングジョブのリストを表示するには、tuningJobs.cancel メソッドを使用して GET リクエストを送信し、TuningJob_ID を指定します。

リクエストのデータを使用する前に、次のように置き換えます。

PROJECT_ID:
TUNING_JOB_REGION: チューニングジョブを実行するリージョン。これは、チューニング済みのモデルをアップロードするデフォルトのリージョンでもあります。
TUNING_JOB_ID: チューニングジョブの ID。

HTTP メソッドと URL:

POST https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs/TUNING_JOB_ID:cancel

リクエストを送信するには、次のいずれかのオプションを選択します。

curl

次のコマンドを実行します。

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d "" \
     "https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs/TUNING_JOB_ID:cancel"

PowerShell

次のコマンドを実行します。

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -Uri "https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs/TUNING_JOB_ID:cancel" | Select-Object -Expand Content

次のような JSON レスポンスが返されます。

レスポンス

{}

Vertex AI SDK for Python

import vertexai
from vertexai.tuning import sft

# TODO(developer): Update and un-comment below lines
# PROJECT_ID = "your-project-id"
# LOCATION = "us-central1"
vertexai.init(project=PROJECT_ID, location=LOCATION)

tuning_job_id = "4982013113894174720"
job = sft.SupervisedTuningJob(
    f"projects/{PROJECT_ID}/locations/{LOCATION}/tuningJobs/{tuning_job_id}"
)
job.cancel()

コンソール

Google Cloud コンソールでチューニングジョブをキャンセルするには、[Vertex AI Studio] ページに移動します。

Vertex AI Studio に移動
[Gemini Pro チューニング済みモデル] の表で、[ 実行を管理] をクリックします。
[キャンセル] をクリックします。

チューニング済みモデルを評価する

チューニングジョブの後に自動的に実行するように Gen AI Evaluation Service を構成していない場合は、Vertex AI SDK for Python または Google Gen AI SDK を使用するか、generateContent メソッドを使用して POST リクエストを送信することで、ベース Gemini と同じ方法でチューニング済みモデルエンドポイントを操作できます。

思考モデルの場合、最適なパフォーマンスと費用効率を実現するために、チューニングされたタスクで思考を無効にするか、思考予算を最小値に設定することをおすすめします。そうすることで、教師ありファインチューニングにおいてモデルがチューニングデータセットの正解を模倣するように学習し、思考プロセスを省略します。そのため、チューニングされたモデルは思考予算なしでタスクを効果的に処理できます。

次の例では、「空はなぜ青いの？」という質問をモデルに提示します。

コンソール

チューニング済みモデルの詳細を Google Cloud コンソールで表示するには、[Vertex AI Studio] ページに移動します。

Vertex AI Studio に移動
[Gemini Pro チューニング済みモデル] の表で、[テスト] を選択します。

チューニングしたモデルで会話を作成できるページが開きます。

Google Gen AI SDK

from google import genai
from google.genai.types import HttpOptions

client = genai.Client(http_options=HttpOptions(api_version="v1"))

# Get the tuning job and the tuned model.
# Eg. tuning_job_name = "projects/123456789012/locations/us-central1/tuningJobs/123456789012345"
tuning_job = client.tunings.get(name=tuning_job_name)

contents = "Why is the sky blue?"

# Predicts with the tuned endpoint.
response = client.models.generate_content(
    model=tuning_job.tuned_model.endpoint,
    contents=contents,
)
print(response.text)
# Example response:
# The sky is blue because ...

Vertex AI SDK for Python

from vertexai.generative_models import GenerativeModel

sft_tuning_job = sft.SupervisedTuningJob("projects/<PROJECT_ID>/locations/<TUNING_JOB_REGION>/tuningJobs/<TUNING_JOB_ID>")
tuned_model = GenerativeModel(sft_tuning_job.tuned_model_endpoint_name)
print(tuned_model.generate_content(content))

REST

プロンプトを使用してチューニング済みモデルをテストするには、POST リクエストを送信して TUNED_ENDPOINT_ID を指定します。

リクエストのデータを使用する前に、次のように置き換えます。

PROJECT_ID:
TUNING_JOB_REGION: チューニングジョブを実行するリージョン。これは、チューニング済みのモデルをアップロードするデフォルトのリージョンでもあります。
ENDPOINT_ID: GET API から取得したチューニング済みモデルのエンドポイント ID。
TEMPERATURE: 温度は、topP と topK が適用された場合に発生するレスポンス生成時のサンプリングに使用されます。温度は、トークン選択のランダム性の度合いを制御します。温度が低いほど、確定的で自由度や創造性を抑えたレスポンスが求められるプロンプトに適しています。一方、温度が高いと、より多様で創造的な結果を導くことができます。温度が 0 の場合、確率が最も高いトークンが常に選択されます。この場合、特定のプロンプトに対するレスポンスはほとんど確定的ですが、わずかに変動する可能性は残ります。
モデルが返すレスポンスが一般的すぎる、短すぎる、あるいはフォールバック（代替）レスポンスが返ってくる場合は、温度を高く設定してみてください。
TOP_P: Top-P は、モデルが出力用にトークンを選択する方法を変更します。トークンは、確率の合計が Top-P 値に等しくなるまで、確率の高いものから低いものへと選択されます。たとえば、トークン A、B、C の確率が 0.3、0.2、0.1 であり、トップ P 値が 0.5 であるとします。この場合、モデルは温度を使用して A または B を次のトークンとして選択し、C は候補から除外します。
ランダムなレスポンスを減らしたい場合は小さい値を、ランダムなレスポンスを増やしたい場合は大きい値を指定します。
TOP_K: Top-K は、モデルが出力用にトークンを選択する方法を変更します。Top-K が 1 の場合、次に選択されるトークンは、モデルの語彙内のすべてのトークンで最も確率の高いものであることになります（グリーディデコードとも呼ばれます）。Top-K が 3 の場合は、最も確率が高い上位 3 つのトークンから次のトークン選択されることになります（温度を使用します）。
トークン選択のそれぞれのステップで、最も高い確率を持つ Top-K のトークンがサンプリングされます。その後、トークンはトップ P に基づいてさらにフィルタリングされ、最終的なトークンは温度サンプリングを用いて選択されます。

ランダムなレスポンスを減らしたい場合は小さい値を、ランダムなレスポンスを増やしたい場合は大きい値を指定します。
MAX_OUTPUT_TOKENS: レスポンスで生成できるトークンの最大数。1 トークンは約 4 文字です。100 トークンは約 60～80 語に相当します。
回答を短くしたい場合は小さい値を、長くしたい場合は大きい値を指定します。

HTTP メソッドと URL:

POST https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/endpoints/ENDPOINT_ID:generateContent

リクエストの本文（JSON）:

{
    "contents": [
        {
            "role": "USER",
            "parts": {
                "text" : "Why is sky blue?"
            }
        }
    ],
    "generation_config": {
        "temperature":TEMPERATURE,
        "topP": TOP_P,
        "topK": TOP_K,
        "maxOutputTokens": MAX_OUTPUT_TOKENS
    }
}

リクエストを送信するには、次のいずれかのオプションを選択します。

curl

リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/endpoints/ENDPOINT_ID:generateContent"

PowerShell

リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/endpoints/ENDPOINT_ID:generateContent" | Select-Object -Expand Content

次のような JSON レスポンスが返されます。

レスポンス

{
  "candidates": [
    {
      "content": {
        "role": "model",
        "parts": [Why is sky blue?
          {
            "text": "The sky appears blue due to a phenomenon called Rayleigh scattering, where shorter blue wavelengths of sunlight are scattered more strongly by the Earth's atmosphere than longer red wavelengths."
          }
        ]
      },
      "finishReason": "STOP",
      "safetyRatings": [
        {
          "category": "HARM_CATEGORY_HATE_SPEECH",
          "probability": "NEGLIGIBLE",
          "probabilityScore": 0.06325052,
          "severity": "HARM_SEVERITY_NEGLIGIBLE",
          "severityScore": 0.03179867
        },
        {
          "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
          "probability": "NEGLIGIBLE",
          "probabilityScore": 0.09334688,
          "severity": "HARM_SEVERITY_NEGLIGIBLE",
          "severityScore": 0.027742893
        },
        {
          "category": "HARM_CATEGORY_HARASSMENT",
          "probability": "NEGLIGIBLE",
          "probabilityScore": 0.17356819,
          "severity": "HARM_SEVERITY_NEGLIGIBLE",
          "severityScore": 0.025419652
        },
        {
          "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
          "probability": "NEGLIGIBLE",
          "probabilityScore": 0.07864238,
          "severity": "HARM_SEVERITY_NEGLIGIBLE",
          "severityScore": 0.020332353
        }
      ]
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 5,
    "candidatesTokenCount": 33,
    "totalTokenCount": 38
  }
}

チューニング済みモデルを削除する

チューニング済みモデルを削除するには:

REST

models.delete メソッドを呼び出します。

リクエストのデータを使用する前に、次のように置き換えます。

PROJECT_ID:
REGION: チューニング済みモデルが配置されているリージョン。
MODEL_ID: 削除するモデル。

HTTP メソッドと URL:

DELETE https://REGION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/REGION/models/MODEL_ID

リクエストを送信するには、次のいずれかのオプションを選択します。

curl

次のコマンドを実行します。

curl -X DELETE \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     "https://REGION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/REGION/models/MODEL_ID"

PowerShell

次のコマンドを実行します。

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method DELETE `
    -Headers $headers `
    -Uri "https://REGION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/REGION/models/MODEL_ID" | Select-Object -Expand Content

成功したことを示すステータスコード（2xx）と空のレスポンスが返されます。

Vertex AI SDK for Python

from google.cloud import aiplatform

aiplatform.init(project=PROJECT_ID, location=LOCATION)

# To find out which models are available in Model Registry
models = aiplatform.Model.list()

model = aiplatform.Model(MODEL_ID)
model.delete()

チューニングと検証の指標

モデルのチューニングとモデルの評価の指標を収集して報告するよう、モデルのチューニングジョブを構成できます。その後、Vertex AI Studio でこれらの指標を可視化できます。

チューニング済みモデルの詳細を Google Cloud コンソールで表示するには、[Vertex AI Studio] ページに移動します。

[Vertex AI Studio] に移動
[チューニングと抽出] テーブルで、指標を表示する調整済みモデルの名前をクリックします。

チューニング指標は [モニタリング] タブに表示されます。

モデルチューニングの指標

モデルのチューニングジョブは、Gemini 2.0 Flash について次のチューニング指標を自動的に収集します。

/train_total_loss: トレーニングステップでのチューニングデータセットの損失。
/train_fraction_of_correct_next_step_preds: トレーニングステップでのトークンの精度。1 回の予測は一連のトークンで構成されます。この指標は、チューニング用データセットのグラウンドトゥルースと比較したときに予測される、トークンの精度を測定します。
/train_num_predictions: トレーニングステップで予測されるトークンの数。

モデル検証の指標

モデルのチューニングジョブを構成して、Gemini 2.0 Flash について次の検証指標を収集できます。

/eval_total_loss: 検証ステップでの検証データセットの損失。
/eval_fraction_of_correct_next_step_preds: 評価ステップでのトークンの精度。1 回の予測は一連のトークンで構成されます。この指標は、検証データセットのグラウンドトゥルースと比較したときに予測される、トークンの精度を測定します。
/eval_num_predictions: 検証ステップで予測されるトークンの数。

指標の可視化は、チューニングジョブの実行が開始された後に利用できます。チューニングの進捗に応じてリアルタイムで更新されます。チューニングジョブの作成時に検証データセットを指定しなかった場合、チューニング指標の可視化のみを行うことができます。

次のステップ

チューニング済み Gemini モデルのデプロイについて確認する。
生成 AI ナレッジベースを構築するソリューションで教師ありファインチューニングを使用する方法については、ジャンプスタートソリューション: 生成 AI ナレッジベースをご覧ください。
Vertex AI 教師ありファインチューニングを使用して生成 AI モデルをファインチューニングする方法を学習する

教師ありファインチューニングを使用して Gemini モデルをチューニングする

始める前に

サポートされているモデル

調整ジョブを作成する

コンソール

Google Gen AI SDK

Vertex AI SDK for Python

REST

curl

PowerShell

レスポンス

curl コマンドの例

Colab Enterprise

ハイパーパラメータの調整

チューニング ジョブのリストを表示する

コンソール

Google Gen AI SDK

Vertex AI SDK for Python

REST

curl

PowerShell

レスポンス

チューニング ジョブの詳細を取得する

コンソール

Google Gen AI SDK

Vertex AI SDK for Python

REST

curl

PowerShell

レスポンス

チューニング ジョブをキャンセルする

REST

curl

PowerShell

レスポンス

Vertex AI SDK for Python

コンソール

チューニング済みモデルを評価する

コンソール

Google Gen AI SDK

Vertex AI SDK for Python

REST

curl

PowerShell

レスポンス

チューニング済みモデルを削除する

REST

curl

PowerShell

Vertex AI SDK for Python

チューニングと検証の指標

モデル チューニングの指標

モデル検証の指標

次のステップ

チューニングジョブのリストを表示する

チューニングジョブの詳細を取得する

チューニングジョブをキャンセルする

モデルチューニングの指標