利用可能な生成 AI モデル

Google Distributed Cloud(GDC)エアギャップ上の Vertex AI には、エアギャップ アプリケーションでテスト、デプロイ、実装できる基盤となる生成 AI モデルがあり、その数は増え続けています。基盤モデルは特定のユースケースに合わせてファインチューニングされており、さまざまな価格で提供されます。このページでは、GDC の生成 AI API で使用可能なモデル ファミリーの概要と、ユースケースごとに選択するモデルに関するガイダンスを示します。

エンベディング モデル

エンベディングは、自然言語で記述されたテキストデータを数値ベクトルに変換します。これらのベクトル表現は、対象となる単語の意味論的意味とコンテキストを取り込むように設計されています。テキスト エンベディング モデルは、ドキュメントの検索、質問と回答、分類、事実の検証など、さまざまなタスクタイプに最適化されたエンベディングを生成できます。英語のテキストには text-embedding-004 を使用します。多言語テキストには text-multilingual-embedding-002 を使用します。

次の表は、Embeddings API で利用可能なモデルをまとめたものです。エンベディングの詳細については、テキスト エンベディングをご覧ください。

モデル 説明 仕様
テキスト エンベディング

text-embedding-004
英語のテキスト入力のエンベディングを返します。 最大トークン入力: 2,048。

エンベディング次元数: 768 未満。
多言語テキスト エンベディング

text-multilingual-embedding-002
100 を超える言語のテキスト入力のエンベディングを返します。 最大トークン入力: 2,048。

エンベディング次元数: 768 未満。