本頁面提供先決條件和詳細操作說明,說明如何使用監督式學習,根據文件資料微調 Gemini。
用途
微調功能可讓您根據特定需求自訂強大的語言模型。以下列舉幾個主要用途,說明如何透過自訂 PDF 檔案微調模型,大幅提升模型效能:
- 內部知識庫:將內部文件轉換為 AI 知識庫,即時提供答案和洞察資訊。舉例來說,銷售代表可以立即從先前的訓練教材中,存取產品規格和價格詳細資料。
- 研究助理:建立研究助理,分析一系列研究論文、文章和書籍。研究氣候變遷的學者可以快速分析科學論文,找出海平面上升的趨勢,或評估不同減緩策略的成效。
- 法律或法規遵循:針對法律文件進行微調,有助於自動審查合約,並標示潛在的不一致或風險區域。讓法律專業人員專注於更高層次的工作,同時確保法規遵循。
- 自動產生報表:自動分析複雜的財務報表、擷取主要成效指標,並為利害關係人產生摘要。與手動分析相比,這項功能可節省時間並降低錯誤風險。
- 內容摘要和分析:摘要長篇 PDF 文件、擷取重要洞察資訊,以及分析趨勢。舉例來說,市場研究團隊可以分析一系列顧客問卷調查,找出主要主題和情緒。
- 文件比較和版本管控:比較不同版本的文件,找出變更內容並追蹤修訂項目。在多位作者共同編輯文件的協作環境中,這項功能特別實用。
限制
Gemini 2.5 模型
規格 | 值 |
---|---|
每個範例的 PDF 頁數上限 | 300 |
每個範例的 PDF 檔案數上限 | 4 |
PDF 檔案大小上限 | 20 MB |
Gemini 2.0 Flash
Gemini 2.0 Flash-Lite
規格 | 值 |
---|---|
每個範例的 PDF 頁數上限 | 300 |
每個範例的 PDF 檔案數上限 | 4 |
PDF 檔案大小上限 | 20 MB |
如要進一步瞭解文件理解功能的需求條件,請參閱「文件理解」。
資料集格式
資料集的 fileUri
可以是 Cloud Storage 值區中檔案的 URI,也可以是公開可用的 HTTP 或 HTTPS 網址。
如要查看一般格式範例,請參閱「Gemini 的資料集範例」。
以下是文件資料集的範例。
{
"contents": [
{
"role": "user",
"parts": [
{
"fileData": {
"mimeType": "application/pdf",
"fileUri": "gs://cloud-samples-data/generative-ai/pdf/2403.05530.pdf"
}
},
{
"text": "You are a very professional document summarization specialist. Please summarize the given document."
}
]
},
{
"role": "model",
"parts": [
{
"text": "The report introduces Gemini 2.0 Flash, a multimodal AI model developed by Google DeepMind. The report positions Gemini 2.0 Flash as a significant advancement in multimodal AI, pushing the boundaries of long-context understanding and opening new avenues for future research and applications."
}
]
}
]
}
後續步驟
- 如要進一步瞭解 Gemini 模型的文件理解功能,請參閱「文件理解」總覽。
- 如要開始調整,請參閱「使用監督式微調功能調整 Gemini 模型」一文。
- 如要瞭解如何將監督式微調用於建構生成式 AI 知識庫的解決方案,請參閱「快速部署解決方案:生成式 AI 知識庫」。