Llama は、Meta が開発したオープンモデルのコレクションです。このモデルは、Vertex AI でファイン チューニングとデプロイを行うことができます。Llama は、アシスタントのようなチャット用に事前トレーニングされ、指示でチューニングされた生成テキストモデルとマルチモーダル モデルを提供します。Vertex AI には Llama 3.2、Llama 3.1、Llama 3、Llama 2 モデルをデプロイできます。
Llama 3.2
Llama 3.2 を使用すると、デベロッパーは最新の生成 AI モデルとアプリケーションを構築してデプロイできます。Llama の機能を使用して、画像推論などの新しいイノベーションを促進できます。Llama 3.2 は、オンデバイス アプリケーションでよりアクセスしやすくなるように設計されています。次のリストは、Llama 3.2 の機能をまとめたものです。
- 小規模なモデルをデバイス上で処理することで、よりプライバシーに配慮したパーソナライズされた AI エクスペリエンスを提供します。
- レイテンシを短縮し、パフォーマンスを向上させるように設計されたモデルを提供します。これにより、幅広いアプリケーションに適しています。
- Llama Stack 上に構築されているため、アプリケーションの構築とデプロイが容易です。Llama Stack は、標準的なツールチェーン コンポーネントとエージェント アプリケーションを構築するための標準化されたインターフェースです。
- 画像エンコーダ表現を言語モデルに統合する新しいモデル アーキテクチャにより、ビジョン タスクをサポートします。
1B モデルと 3B モデルは、多言語ローカル知識の検索、要約、書き換えなど、デバイス上の使用ケースをサポートする軽量のテキストのみのモデルです。
Llama 11B モデルと 90B モデルは、画像推論を備えた小規模および中規模のマルチモーダル モデルです。たとえば、チャートから視覚データを分析してより正確な回答を提供したり、画像から詳細を抽出してテキストの説明を生成したりできます。
詳細については、Model Garden の Llama 3.2 モデルカードをご覧ください。
考慮事項
11B と 90B を使用する場合、テキストのみのプロンプトを送信する際の制限はありません。ただし、プロンプトに画像を含める場合は、画像をプロンプトの先頭に配置する必要があります。また、画像は 1 つだけ含めることができます。テキストと画像を交互に配置することはできません。
Llama 3.1
多言語大規模言語モデル(LLM)の Llama 3.1 コレクションは、8B、70B、405B のサイズ(テキスト入力 / テキスト出力)の事前トレーニング済みモデルと指示用にチューニングされた生成モデルのコレクションです。Llama 3.1 の指示用にチューニングされたテキストのみのモデル(8B、70B、405B)は、多言語の会話のユースケース用に最適化されています。一般的な業界ベンチマークでは、利用可能なオープンソース チャットモデルやクローズド チャットモデルの多くを上回るパフォーマンスを発揮します。
詳細については、Model Garden の Llama 3.1 モデルカードをご覧ください。
Llama 3
Llama 3 の指示用にチューニングされたモデルは、会話のユースケース用に最適化された LLM のコレクションです。Llama 3 モデルは、一般的な業界ベンチマークで、利用可能なオープンソース チャットモデルの多くよりも優れたパフォーマンスを発揮しています。
詳細については、Model Garden の Llama 3 モデルカードをご覧ください。
Llama 2
Llama 2 LLM は、事前トレーニング済みかつファインチューニング済みの生成テキストモデルのコレクションで、7B~70B のパラメータを使用します。
詳細については、Model Garden の Llama 2 モデルカードをご覧ください。
Code Llama
Meta の Code Llama モデルは、コードの合成、理解、命令を目的として設計されています。
詳細については、Model Garden の Code Llama モデルカードをご覧ください。
Llama Guard 3
Llama Guard 3 は Llama Guard 2 の機能に基づいて構築されており、名誉毀損、選挙、コード インタープリタの不正使用の 3 つの新しいカテゴリが追加されています。また、このモデルは多言語対応で、Llama 3 以降の指示モデルと一致するプロンプト形式を備えています。
詳細については、Model Garden の Llama Guard モデルカードをご覧ください。
リソース
Model Garden の詳細については、Model Garden で AI モデルを確認するをご覧ください。