このドキュメントでは、Gemini API に関するよくある質問(FAQ)の回答を次のカテゴリに分類して紹介しています。
モデルの比較
PaLM と Gemini の違いは何ですか?
Gemini モデルはマルチモーダル アプリケーション向けに設計されています。Gemini モデルは、テキストや画像などのプロンプトを受け入れ、テキスト レスポンスを返します。Gemini では関数の呼び出しもサポートしています。これにより、デベロッパーは関数の説明を渡し、モデルが説明に最も適合する関数とパラメータを返すことができます。デベロッパーは、外部の API およびサービスで対象の関数を呼び出すことができます。
PaLM 2 モデルは一般提供(GA)となっています。PaLM 2 モデルは言語アプリケーション向けに設計されており、テキスト要約やテキスト生成などのユースケースで優れたパフォーマンスを発揮します。PaLM 2 は、モデル モニタリングなどの Vertex AI 上の MLOps サービスに対する完全なサポートも提供します。これは、Gemini では使用できません。
Vertex AI Studio を使用すると、完全なデータ制御で Gemini モデルと PaLM 2 モデルの両方をカスタマイズし、Google Cloud のセキュリティ、安全性、プライバシー、データ ガバナンスとコンプライアンス サポートを活用できます。Gemini と PaLM 2 の両方のプロンプトとチューニング データが、基盤モデルのトレーニングや強化に使用されることはありません。
Gemini ではなく PaLM を選ぶ理由は何ですか?
テキストの要約、テキスト生成、Q&A など、テキストの入出力のみを必要とするユースケースでは、PaLM 2 モデルで十分に高品質なレスポンスを提供できます。
Gemini のモデルは、マルチモーダル入力を含むユースケース、関数呼び出しが必要なユースケース、複雑なプロンプト手法(ソートチェーンや複雑な指示など)が必要なユースケースに適しています。
PaLM 2 はサポート終了になるのですか?
PaLM 2 のサポートを終了する予定はありません。
ビジョンのユースケースにおける Vertex AI の Imagen と Gemini API の違いは何ですか?
Imagen は、画像の生成、編集、キャプション、Q&A のユースケース用のビジョンモデルです。プロンプトの一部として、Gemini は複数の画像または動画を取り込み、入力に関する回答を提供できます。これに対して、Imagen は 1 つの入力画像のみを取り込みます。Gemini は、画像生成や画像編集をサポートしていません。
コーディングのユースケースにおける Vertex AI Codey API と Gemini API の違いは何ですか?
Codey API は、コード生成、コード補完、コードチャットに特化して構築されています。Codey API は、Gemini などの Google が開発したモデルを利用しています。IDE、CI / CD ワークフロー、ダッシュボード、その他のアプリケーションに統合することで、ソフトウェア開発ライフサイクル全体で API を使用できます。コードベースを使用してモデルをカスタマイズすることもできます。コード生成に Gemini 1.0 Pro Vision を使用することはおすすめしません。
Gemini 1.0 Pro モデルまたは Gemini 1.0 Pro Vision モデルにプロンプトを送信するにはどうすればよいですか?
Gemini API にリクエストを送信するには、いくつかの方法があります。たとえば、Google Cloud コンソール、プログラミング言語 SDK、または REST API を使用して、gemini-1.0-pro
(Gemini 1.0 Pro)または gemini-1.0-pro-vision
(Gemini 1.0 Pro Vision)にリクエストを送信できます。
使用を開始するには、Gemini API を試すをご覧ください。
Gemini でファインチューニング機能を利用できますか?
Gemini 1.0 Pro(gemini-1.0-pro-002
)の安定版のバージョン 002 をファインチューニングできます。詳細については、Gemini のモデル チューニングの概要をご覧ください。
安全性とデータの使用
レスポンスがブロックされるのはなぜですか?
Vertex AI の生成 AI は、安全フィルタを使用して、有害な可能性のあるレスポンスの生成を回避します。この安全フィルタのしきい値は調整できます。詳細については、責任ある AI をご覧ください。
入力データはどのように使用されますか?
Google は、Google Cloud がプロダクト開発で使用するデータのレビューなど、堅牢なデータ ガバナンスの手法を通じて、チームが AI / ML のプライバシーへの取り組みを遵守できるようにしています。詳細については、生成 AI とデータ ガバナンスをご覧ください。
データをキャッシュに保存しますか?
Google では、Gemini モデルに対するお客様の入力と出力をキャッシュに保存し、お客様からの後続のプロンプトに対するレスポンスを高速化することが可能です。コンテンツはキャッシュに最長 24 時間保存されます。デフォルトでは、各 Google Cloud プロジェクトでデータ キャッシュが有効になっています。Google Cloud プロジェクトの同じキャッシュ設定がすべてのリージョンに適用されます。次の curl コマンドを使用すると、キャッシュのステータスを取得すること、キャッシュを無効にすること、キャッシュを再度有効にすることが可能です。詳細については、生成 AI とデータ ガバナンスのページの予測をご覧ください。キャッシュを無効にするか、再度有効にすると、その変更はすべての Google Cloud リージョンに適用されます。Identity and Access Management を使用して、キャッシュを有効または無効にするために必要な権限を付与する方法の詳細については、IAM による Vertex AI のアクセス制御をご覧ください。現在のキャッシュ設定を取得する方法、キャッシュを無効にする方法、キャッシュを有効にする方法については、以下のセクションを開いてください。
現在のキャッシュ設定を取得する
次のコマンドを実行して、プロジェクトでキャッシュが有効になっているか無効になっているかを確認します。このコマンドを実行するには、ユーザーに roles/aiplatform.viewer
、roles/aiplatform.user
、または roles/aiplatform.admin
のいずれかのロールを付与する必要があります。
PROJECT_ID=PROJECT_ID # Setup project_id $ gcloud config set project PROJECT_ID # GetCacheConfig $ curl -X GET -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" -H "Content-Type: application/json" https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/cacheConfig # Response if caching is enabled (caching is enabled by default). { "name": "projects/PROJECT_ID/cacheConfig" } # Response if caching is disabled. { "name": "projects/PROJECT_ID/cacheConfig" "disableCache": true }
キャッシュを無効にする
次の curl コマンドを実行して、Google Cloud プロジェクトのキャッシュを無効にします。このコマンドを実行するには、ユーザーに Vertex AI 管理者ロール(roles/aiplatform.admin
)を付与する必要があります。
PROJECT_ID=PROJECT_ID # Setup project_id $ gcloud config set project PROJECT_ID # Setup project_id. $ gcloud config set project ${PROJECT_ID} # Opt-out of caching. $ curl -X PATCH -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" -H "Content-Type: application/json" https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/cacheConfig -d '{ "name": "projects/PROJECT_ID/cacheConfig", "disableCache": true }' # Response. { "name": "projects/PROJECT_ID/locations/us-central1/projects/PROJECT_ID/cacheConfig/operations/${OPERATION_ID}", "done": true, "response": { "@type": "type.googleapis.com/google.protobuf.Empty" } }
キャッシュ保存を有効にする
Google Cloud プロジェクトのキャッシュを無効にして、再度有効にするには、次の curl コマンドを実行します。このコマンドを実行するには、ユーザーに Vertex AI 管理者ロール(roles/aiplatform.admin
)を付与する必要があります。
PROJECT_ID=PROJECT_ID LOCATION_ID="us-central1" # Setup project_id $ gcloud config set project PROJECT_ID # Setup project_id. $ gcloud config set project ${PROJECT_ID} # Opt in to caching. $ curl -X PATCH -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" -H "Content-Type: application/json" https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/cacheConfig -d '{ "name": "projects/PROJECT_ID/cacheConfig", "disableCache": false }' # Response. { "name": "projects/PROJECT_ID/locations/us-central1/projects/PROJECT_ID/cacheConfig/operations/${OPERATION_NUMBER}", "done": true, "response": { "@type": "type.googleapis.com/google.protobuf.Empty" } }
移行
Google AI Studio 上の Gemini を Vertex AI Studio に移行するにはどうすればよいですか?
Google Cloud の Vertex AI Platform に移行すると、効率と信頼性を高めるために AI モデルの使用、デプロイ、モニタリングを合理化する一連の MLOps ツールが提供されます。作業を Vertex AI に移行するには、既存のデータをインポートして Vertex AI Studio にアップロードし、Vertex AI Gemini API を使用します。詳細については、Google AI の Gemini から Vertex AI への移行をご覧ください。
基盤となるモデルとして PaLM 2 から Vertex AI Gemini API に切り替えるにはどうすればよいですか?
PaLM モデルから Gemini モデルに切り替えるときに、アプリケーションのアーキテクチャを大幅に変更する必要はありません。API の観点からは、モデルを切り替えるには、コードを 1 行変更するか、SDK を更新する必要があります。詳細については、PaLM API から Vertex AI Gemini API に移行するをご覧ください。
レスポンスはモデルによって異なる可能性があるため、プロンプト テストを行い、PaLM モデルと Gemini モデルのレスポンスを比較し、レスポンスが期待どおりであることを確認することをおすすめします。
リリース情報と料金
Gemini はどのロケーションで利用できますか?
Gemini 1.0 Pro と Gemini 1.0 Pro Vision は、アジア、米国、ヨーロッパの各リージョンで利用できます。詳細については、Vertex AI ロケーションの生成 AI をご覧ください。
Vertex AI Gemini API の無料評価枠はありますか?
詳細については、Google Cloud 担当者にお問い合わせください。
Vertex AI Gemini API の料金を教えてください。
Gemini モデルの料金情報については、Vertex AI の生成 AI の料金のマルチモーダル セクションをご覧ください。
Gemini Ultra にアクセスするにはどうすればよいですか?
アクセス権のリクエストについては、Google アカウント担当者にお問い合わせください。
割り当て
API リクエスト時の割り当て(429)エラーを解決するにはどうすればよいですか?
過度の需要があるか、リクエストがプロジェクトごとの割り当てを超過しています。リクエスト率がプロジェクトの割り当てより小さな値であることを確認します。プロジェクトの割り当てを表示するには、Google Cloud コンソールの [割り当て] ページに移動します。詳細については、Vertex AI の生成 AI に関する割り当てと上限をご覧ください。
Gemini に対するプロジェクトの割り当て量を引き上げるにはどうすればよいですか?
割り当ての増加は Google Cloud コンソールからリクエストできます。詳細については、Vertex AI の生成 AI に関する割り当てと上限をご覧ください。