Vertex AI Model Optimizer は、ニーズに最も適した Gemini モデルを自動的に適用することでモデル選択を簡素化するように設計された動的エンドポイントです。これにより、プロンプトを単一のメタエンドポイントに指すことができます。サービスは、費用と品質の設定に基づいて、クエリに最も適した Gemini モデル(Pro、Flash など)をインテリジェントに選択します。
Model Optimizer の料金の詳細については、料金をご覧ください。
利点
Model Optimizer を使用すると、次のことができます。
- アプリケーションごとにモデルを選択するのではなく、モデルの選択を簡素化
- コスト、品質、またはその両方を最適化して、パフォーマンスと予算のバランスを取る
- 既存の Gemini API と SDK とシームレスに統合
- 使用状況を追跡して費用削減の可能性を特定する
- エンドポイントを手動で選択しなくても、テキストベースのタスクを効率的に処理する
サポートされているモデル
- Gemini 2.0 Flash(一般提供)
- Gemini 2.5 Pro(プレビュー、3 月 25 日)
言語サポート
Model Optimizer は、Gemini モデルでサポートされているすべての言語をサポートしています。(Gemini の言語サポートを参照)
モダリティ
Model Optimizer は、次のようなテキストのユースケースをサポートしています。
- コーディング(関数呼び出しやコード実行など)
- 要約
- シングルターン チャットとマルチターン チャット
- 質問応答
制限事項とその対処方法については、サポートされていない機能の処理をご覧ください。
ご利用にあたって
Model Optimizer の使用を開始するには、クイックスタートの Colab ノートブックをご覧ください。
Vertex AI Model Optimizer の使用
Gen AI SDK for Python
インストール
pip install --upgrade google-genai
詳細については、 SDK リファレンス ドキュメントをご覧ください。
Vertex AI で Gen AI SDK を使用するための環境変数を設定します。
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
サポートされていない機能の処理
Model Optimizer は、テキストの入力と出力のみをサポートしています。ただし、リクエストに、サポートされていないさまざまなモダリティやツールが含まれている場合があります。以降のセクションでは、サポートされていないこれらの特徴量を Model Optimizer がどのように処理するかについて説明します。
マルチモーダル リクエスト
動画、画像、音声などのマルチモーダル データを含むプロンプトを含むリクエストは、INVALID_ARGUMENT
エラーをスローします。
サポートされていないツール
Model Optimizer は、リクエストの関数宣言のみをサポートしています。リクエストに google_maps
、google_search
、enterprise_web_search
、retrieval
、browse
などの他のツールタイプが含まれている場合、INVALID_ARGUMENT
エラーがスローされます。
フィードバックを送信
Model Optimizer の使用感に関するフィードバックを送信するには、フィードバック アンケートにご記入ください。
Model Optimizer に関する質問、技術的な問題、フィードバックについては、model-optimizer-support@google.com までお問い合わせください。
お客様のディスカッション グループ
開発チームと直接つながるには、Vertex AI Model Optimizer リスニング グループに参加してください。このグループでは、プロダクトについて学び、機能の改善につながる情報を提供できます。このグループのアクティビティとしては、次のものがあります。
- 機能について学ぶ仮想ワークショップ
- フィードバック アンケートでニーズと優先事項を共有
- 新機能を紹介する社員との 1 対 1 のセッション Google Cloud
アクティビティは 6 ~ 8 週間に 1 回の割合で実施されます。参加できるアクティビティの数に制限はありません。また、いつでも参加を止めることができます。このグループに参加するには、Vertex AI Model Optimizer ディスカッション グループの登録フォームに入力してください。