使用 Vertex AI 中的 Gemini API 将应用迁移到 Gemini 2

本指南介绍了如何将生成式 AI 应用从 Gemini 1.x 和 PaLM 模型迁移到 Gemini 2 模型。

为什么要迁移到 Gemini 2?

与 Gemini 1.x 和 PaLM 模型相比,Gemini 2 的性能显著提升,并新增了多项功能。此外,每个模型版本都有自己的版本支持和可用时间表

将大多数生成式 AI 应用升级到 Gemini 2 应该不需要对提示或代码进行大幅度重构。但是,某些应用需要提示性更改,如果不先通过 Gemini 2 运行提示,这些更改就很难预测。因此,建议您在迁移前进行 Gemini 2 测试。

只有在发生某些破坏性更改或要使用 Gemini 2 的新功能时,才需要进行重大的代码更改。

我应该迁移到哪个 Gemini 2 模型?

在选择要迁移到的 Gemini 2 模型时,您需要考虑应用所需的功能以及这些功能的费用

如需概览 Gemini 2 模型功能,请参阅 Gemini 2。如需大致了解所有 Google 模型,请参阅 Google 模型

如需比较可用的 Gemini 模型,请参阅下表。

功能 Gemini 1.5 Pro Gemini 1.5 Flash Gemini 2.0 Flash Gemini 2.0 Flash-Lite Gemini 2.5 Pro Gemini 2.5 Flash
输入模式 文本、文档、图片、视频、音频 文本、文档、图片、视频、音频 文本、文档、图片、视频、音频 文本、文档、图片、视频、音频 文本、文档、图片、视频、音频 文本、文档、图片、视频、音频
输出模式 文本 文本 文本 文本 文本 文本
上下文窗口、总 token 数上限 2,097,152 1,048,576 1,048,576 1,048,576 1,048,576 1,048,576
输出上下文长度 8192 8192 8192 8192 64,192 64,192
使用 Google 搜索建立依据
函数调用
代码执行
上下文缓存
批量预测
Live API
延迟时间 1.5 版系列中最强大的设备 1.5 系列中最快 速度快且成本效益高 快速且最具成本效益 比 Flash 慢,但具有良好的成本效益 快速且最具成本效益
微调
推荐的 SDK Vertex AI SDK Vertex AI SDK Gen AI SDK Gen AI SDK Gen AI SDK Gen AI SDK
价格单位 基于字符, 基于字符, 令牌 令牌 令牌 令牌

迁移过程概览

本文档概述了将应用迁移到 Gemini 2 的八步流程。请使用下图浏览各个步骤。

流程

准备工作

说明模型评估和测试要求

代码升级和测试

离线评估

评估评估结果并调整 Gemini 2 提示和超参数

负载测试

在线评估

生产环境部署

提高模型性能

在完成迁移后,请按照以下提示最大限度提升 Gemini 2 模型的性能:

  • 检查您的系统说明提示少样本学习示例,确保其中没有任何不一致、矛盾或不相关的说明和示例。
  • 测试更强大的模型。例如,如果您评估了 Gemini 2.0 Flash-Lite,请试用 Gemini 2.0 Flash。
  • 检查所有自动评估结果,确保它们与人工判断一致,尤其是使用评判模型的结果。确保评判模型说明不存在不一致或模糊不清的情况。
  • 改进评判模型说明的一种方法是,让多个人单独测试这些说明,看看他们的判断是否一致。如果人类对说明的解读不同,做出的判断也不同,则说明您的评判模型说明存在歧义。
  • 微调 Gemini 2 模型
  • 检查评估输出,找出显示特定类型失败情况的模式。将失败问题划分为不同的模型、类型或类别,可让您获得更具针对性的评估数据,从而更轻松地调整提示以解决这些错误。
  • 确保您独立评估不同的生成式 AI 组件。
  • 尝试调整令牌抽样参数

获取帮助

如果您需要帮助,Google Cloud 提供多种支持套餐以满足您的需求,例如全天候支持、手机支持以及技术支持经理对接。如需了解详情,请参阅 Google Cloud 支持。

后续步骤