Vertex AI Model Optimizer は、ニーズに最適な Gemini モデルを自動的に適用することで、モデルの選択を簡素化するように設計された動的エンドポイントです。これにより、プロンプトを単一のメタエンドポイントに向けることができ、このサービスでは費用と品質の優先度に基づいて、クエリに最適な Gemini モデル(Pro、Flash など)がインテリジェントに選択されます。
Model Optimizer の料金の詳細については、料金をご覧ください。
利点
Model Optimizer を使用すると、次のことができます。
- アプリケーションごとにモデルを選択するのではなく、モデルの選択を簡素化する
- コスト、品質、またはその両方を最適化して、パフォーマンスと予算のバランスを取る
- 既存の Gemini API と SDK とシームレスに統合する
- 使用状況を追跡し、費用削減の可能性を特定する
- エンドポイントを手動で選択する必要なしに、テキストベースのタスクを効率的に処理する
サポートされているモデル
- Gemini 2.0 Flash(GA)
- Gemini 2.5 Pro(プレビュー、03-25)
言語サポート
Model Optimizer は、Gemini モデルでサポートされているすべての言語をサポートしています。(Gemini の言語サポートを参照)
モダリティ
Model Optimizer は、次のようなテキスト ユースケースをサポートしています。
- コーディング(関数呼び出しやコード実行を含む)
- 要約
- シングルターン チャットとマルチターン チャット
- 質問と回答
制限事項とその処理方法については、サポートされていない機能の処理をご覧ください。
ご利用にあたって
Model Optimizer の使用を開始するには、クイックスタートの Colab ノートブックをご覧ください。
Vertex AI Model Optimizer の使用
Python
インストール
pip install --upgrade google-genai
詳しくは、SDK リファレンス ドキュメントをご覧ください。
Vertex AI で Gen AI SDK を使用するための環境変数を設定します。
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
サポートされていない機能の処理
Model Optimizer は、テキストの入力と出力のみをサポートします。ただし、リクエストにはサポートされていないさまざまなモダリティやツールが含まれている可能性があります。以降のセクションでは、サポートされていないこれらの機能を Model Optimizer で処理する方法について説明します。
マルチモーダル リクエスト
動画、画像、音声などのマルチモーダル データを伴うプロンプトを含むリクエストは、INVALID_ARGUMENT
エラーをスローします。
サポートされていないツール
Model Optimizer は、リクエストの関数宣言のみをサポートしています。リクエストに google_maps
、google_search
、enterprise_web_search
、retrieval
、browse
などの他のツールタイプが含まれている場合、INVALID_ARGUMENT
エラーがスローされます。
フィードバックを送信する
Model Optimizer の使用感に関するフィードバックを送信するには、フィードバック アンケートに入力してください。
Model Optimizer に関するご質問、技術的な問題、フィードバックについては、model-optimizer-support@google.com にお問い合わせください。
お客様のヘルプグループ
Vertex AI Model Optimizer リスニング グループに参加すると、開発チームと直接つながり、プロダクトに対する理解を深め、プロダクトの品質向上につながる情報を提供できます。このグループのアクティビティとしては、次のものがあります。
- 機能について学ぶ仮想ワークショップ
- フィードバック アンケートでニーズと優先事項を共有
- 新機能を紹介する Google Cloud 社員との 1 対 1 のセッション
アクティビティは 6~8 週間ごとに 1 回の割合で実施されます。参加できるアクティビティの数に制限はありません。また、いつでも参加を止めることができます。グループに参加するには、Vertex AI Model Optimizer ヘルプグループの登録フォームに入力してください。