このページでは、教師あり学習を使用してドキュメント データで Gemini をファインチューニングするための前提条件と詳細な手順について説明します。
ユースケース
ファインチューニングによって、パワフルな言語モデルを特定のニーズに合わせてカスタマイズできます。独自の PDF セットでファインチューニングすることでモデルのパフォーマンスを大幅に向上させることができる主なユースケースは次のとおりです。
- 社内ナレッジベース: 社内ドキュメントを、即時に回答と分析情報を提供する AI 搭載ナレッジベースに変換します。たとえば、営業担当者は過去のトレーニング資料から商品の仕様や価格の詳細に即座にアクセスできます。
- 研究アシスタント: 研究論文、記事、書籍のコレクションを分析できる研究アシスタントを作成します。気候変動を調査している研究者は、科学論文を迅速に分析して海面上昇の傾向を特定したり、さまざまな緩和戦略の効果を評価したりできます。
- 法令や規制の遵守: 法律文書をファインチューニングすることで、契約書の審査を自動化し、潜在的な不整合やリスクのある箇所にフラグを立てることができます。これにより、法務担当者はコンプライアンスを確保しながら、より高度なタスクに集中できます。
- レポートの自動生成: 複雑な財務レポートの分析を自動化し、重要業績評価指標を抽出して関係者向けの要約を生成します。これにより、手動での分析と比較して時間を節約し、エラーのリスクを軽減できます。
- コンテンツの要約と分析: 長い PDF ドキュメントを要約し、重要な分析情報を抽出してトレンドを分析します。たとえば、市場調査チームは、顧客アンケートのコレクションを分析して、主なテーマと感情を特定できます。
- ドキュメントの比較とバージョン管理: ドキュメントの異なるバージョンを比較して変更箇所を特定し、リビジョンを追跡します。これは、1 つのドキュメントに複数の作成者が貢献するコラボレーション環境で特に便利です。
制限事項
- サンプルあたりの最大ページ数: 16
- サンプルあたりの PDF ファイルの最大数: 4
- PDF ファイルの最大サイズ: 20 MB
ドキュメントの理解の要件について詳しくは、ドキュメントの理解をご覧ください。
データセットのフォーマット
データセットの fileUri
は、Cloud Storage バケット内のファイルの URI にすることも、一般公開されている HTTP または HTTPS URL にすることもできます。
汎用形式の例については、Gemini 1.5 Pro と Gemini 1.5 Flash のデータセットの例をご覧ください。
ドキュメント データセットの例を次に示します。
{
"contents": [
{
"role": "user",
"parts": [
{
"fileData": {
"mimeType": "application/pdf",
"fileUri": "gs://cloud-samples-data/generative-ai/pdf/2403.05530.pdf"
}
},
{
"text": "You are a very professional document summarization specialist.Please summarize the given document."
}
]
},
{
"role": "model",
"parts": [
{
"text": "The report introduces Gemini 1.5 Pro, a multimodal AI model developed by Google DeepMind. The report positions Gemini 1.5 Pro as a significant advancement in multimodal AI, pushing the boundaries of long-context understanding and opening new avenues for future research and applications."
}
]
}
]
}
次のステップ
- Gemini モデルのドキュメント理解機能の詳細を確認する。ドキュメント理解の概要をご覧ください。
- チューニングを開始する。教師ありファインチューニングを使用して Gemini モデルをチューニングするをご覧ください。
- 生成 AI ナレッジベースを構築するソリューションで教師ありファインチューニングを使用する方法について、ジャンプ スタート ソリューション: 生成 AI ナレッジベースを確認する。