使用 Vertex AI 中的 Gemini API 將應用程式遷移至 Gemini 2

本指南說明如何將生成式 AI 應用程式從 Gemini 1.x 和 PaLM 模型遷移至 Gemini 2 模型。

為何要遷移至 Gemini 2?

Gemini 2 的效能大幅優於 Gemini 1.x 和 PaLM 模型,且具備新功能。此外,每個型號版本都有版本支援和發布時間表

升級大部分生成式 AI 應用程式至 Gemini 2 時,不必大幅重新設計提示或程式碼。不過,某些應用程式需要變更提示,如果先透過 Gemini 2 執行提示,就很難預測這些變更。因此,建議您在遷移前先進行 Gemini 2 測試。

只有在需要進行重大程式碼變更,或要使用 Gemini 2 的新功能時,才需要進行重大程式碼變更。

我應該遷移至哪個 Gemini 2 模型?

選擇要遷移至的 Gemini 2 模型時,請考量應用程式所需的功能,以及這些功能的成本

如要瞭解 Gemini 2 模型功能的總覽,請參閱 Gemini 2。如需所有 Google 模型的總覽,請參閱「Google 模型」。

如要比較可用的 Gemini 模型,請參閱下表。

功能 Gemini 1.5 Pro Gemini 1.5 Flash Gemini 2.0 Flash Gemini 2.0 Flash-Lite Gemini 2.5 Pro Gemini 2.5 Flash
輸入模式 文字、文件、圖片、影片、音訊 文字、文件、圖片、影片、音訊 文字、文件、圖片、影片、音訊 文字、文件、圖片、影片、音訊 文字、文件、圖片、影片、音訊 文字、文件、圖片、影片、音訊
輸出模式 文字 文字 文字 文字 文字 文字
脈絡窗口、總詞元限制 2,097,152 1,048,576 1,048,576 1,048,576 1,048,576 1,048,576
輸出背景資訊長度 8,192 8,192 8,192 8,192 64,192 64,192
利用搜尋建立基準
函式呼叫
程式碼執行
脈絡快取
批次預測
Live API
延遲時間 1.5 代家族中最強大的產品 1.5 系列中速度最快 快速且具成本效益 快速且最具成本效益 速度較 Flash 慢,但成本效益佳 快速且最具成本效益
微調
建議的 SDK Vertex AI SDK Vertex AI SDK Gen AI SDK Gen AI SDK Gen AI SDK Gen AI SDK
計價單位 字元 字元 權杖 權杖 權杖 權杖

遷移程序總覽

本文件概述了將應用程式遷移至 Gemini 2 的八個步驟。請參考下圖瞭解各個步驟。

程序

事前準備

記錄模型評估和測試要求

程式碼升級和測試

離線評估

評估評估結果,並調整 Gemini 2 提示和超參數

負載測試

線上評估

正式部署

提高模型效能

完成遷移後,請參考下列提示,盡可能提升 Gemini 2 模型的成效:

  • 檢查系統指令提示少樣本學習範例,看看是否有任何不一致、矛盾或不相關的指令和範例。
  • 測試更強大的模型。舉例來說,如果您評估過 Gemini 2.0 Flash-Lite,請試試 Gemini 2.0 Flash。
  • 檢查任何自動評估結果,確保結果與人工判斷一致,尤其是使用評判模型的結果。請確認評審模型指示內容不含不一致或模糊的內容。
  • 改善判斷模型指示的其中一種方法,就是讓多位人類獨立測試指示,看看他們的判斷是否一致。如果人類解讀指示的方式不同,並做出不同的判斷,則判斷模型的指示不明確。
  • 微調 Gemini 2 模型
  • 檢查評估輸出內容,找出顯示特定類型失敗的模式。將失敗項目分組為不同的模型、類型或類別,可讓您取得更精準的評估資料,方便調整提示來解決這些錯誤。
  • 請務必個別評估不同的生成式 AI 元件。
  • 嘗試調整符記取樣參數

取得說明

如需協助,Google Cloud 提供多種支援方案以滿足您的需求,例如全年無休的支援服務、電話支援服務,以及技術支援經理提供的諮詢服務。詳情請參閱 Google Cloud 支援服務。

後續步驟

  • 請參閱常見問題清單。
  • 從 PaLM API 遷移至 Vertex AI 中的 Gemini API。