文件調整

本頁面提供使用監督式學習精細調整 Gemini 處理文件資料的先決條件和詳細操作說明。

用途

您可以根據特定需求,自訂強大的語言模型。以下列舉幾種主要用途,說明使用您自己的 PDF 進行精細調整,可大幅提升模型效能:

  • 內部知識庫:將內部文件轉換為 AI 技術輔助的知識庫,提供即時答案和洞察資料。舉例來說,業務代表可以立即存取過去訓練資料中的產品規格和價格詳細資料。
  • 研究助理:建立研究助理,可分析一系列研究論文、文章和書籍。研究氣候變遷的研究人員可以快速分析科學論文,找出海平上升的趨勢,或評估不同減緩策略的成效。
  • 法律或法規遵循:精細調整法律文件,有助於自動審查合約,並標示潛在的矛盾或風險領域。這樣一來,法律專業人士就能專注於更高層級的工作,同時確保遵循法規。
  • 自動產生報表:自動分析複雜的財務報表、擷取主要成效指標,並為利害關係人產生摘要。與手動分析相比,這麼做可以節省時間,並降低出錯的風險。
  • 內容摘要和分析:摘要冗長的 PDF 文件、擷取重要洞察資料,並分析趨勢。舉例來說,市場研究團隊可以分析一系列顧客問卷調查,找出主要主題和情緒。
  • 文件比較和版本管控:比較文件的不同版本,找出變更內容並追蹤修訂內容。在多位作者共同編輯文件的協作環境中,這項功能特別實用。

限制

Gemini 2.0 Flash-Lite

  • 每個範例的 PDF 頁數上限:300
  • 每個範例的 PDF 檔案數量上限:4 個
  • PDF 檔案大小上限:20 MB

Gemini 2.0 Flash

  • 每個範例的 PDF 頁數上限:300
  • 每個範例的 PDF 檔案數量上限:4 個
  • PDF 檔案大小上限:20 MB

如要進一步瞭解文件理解功能的相關規定,請參閱「文件理解」。

資料集格式

資料集的 fileUri 可以是 Cloud Storage 值區中檔案的 URI,也可以是公開的 HTTP 或 HTTPS 網址。

如要查看通用格式範例,請參閱 Gemini 的資料集範例

以下是文件資料集的範例。

{
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "fileData": {
            "mimeType": "application/pdf",
            "fileUri": "gs://cloud-samples-data/generative-ai/pdf/2403.05530.pdf"
            }
        },
        {
          "text": "You are a very professional document summarization specialist. Please summarize the given document."
        }
      ]
    }, 
    {
      "role": "model",
      "parts": [
        {
          "text": "The report introduces Gemini 2.0 Flash, a multimodal AI model developed by Google DeepMind. The report positions Gemini 2.0 Flash as a significant advancement in multimodal AI, pushing the boundaries of long-context understanding and opening new avenues for future research and applications."
        }
      ]
    }
  ]
}

後續步驟