Gemini 2

Gemini 2 模型是 Vertex AI 支持的最新 Google 模型。本页面介绍了以下模型:

如果您要了解 Gemini 2.5 Pro Experimental 模型,请参阅 Gemini 2.5 Pro Experimental 文档

模型

2.0 Flash

Gemini 2.0 Flash 是我们 Gemini 系列中最新推出的正式版模型。这是适用于所有日常任务的主要模型,具有增强型性能,并支持实时 Live API。

Gemini 2.0 Flash 引入了以下新功能和增强功能:

  • Multimodal Live API:这一新的 API 支持与 Gemini 建立低延迟的双向语音和视频互动。
  • 质量:在大多数质量基准方面,性能得到提升。
  • 改进了智能体功能:2.0 Flash 改进了多模态理解、编码、复杂指令遵从和函数调用功能。这些改进相辅相成,可支持更好的智能体体验。
  • 新模态:2.0 Flash 引入了内置的图片生成和可控的文字转语音功能,可实现图片修改、本地化艺术作品创作和富有表现力的讲故事。

Gemini 2.0 Flash 功能:

  • 多模态输入
  • 文本输出(正式版)/多模态输出(非公开预览)
  • 提示优化器
  • 受控生成功能
  • 函数调用
  • 使用 Google 搜索建立依据
  • 代码执行
  • 计数 token

使用此模型 ID 将 Gemini 2.0 Flash 与 Gen AI SDK 搭配使用:gemini-2.0-flash

功能可用性

以下功能适用于 Gemini 2.0 Flash:

功能 可用性等级
文本生成 已全面推出
使用 Google 搜索建立依据 已全面推出
Gen AI SDK 已全面推出
Multimodal Live API 公开预览版
边界框检测 公开预览版
图片生成 非公开预览版
语音生成 非公开预览版
  • 正式版:此功能已公开发布,并支持在生产级代码中使用。
  • 公开预览版:此功能以较小容量公开发布。请勿在生产代码中使用以公开预览版形式发布的功能,因为该功能的支持级别和作用可能会在没有任何警告的情况下发生更改。
  • 非公开预览:只有列入已获批准的许可名单的用户才能使用此功能。请勿在生产代码中使用以非公开预览版形式发布的功能,因为该功能的支持级别和作用可能会在没有任何警告的情况下发生更改。

价格

如需了解 Gemini 2.0 Flash 的价格,请访问我们的价格页面

配额和限制

Gemini 2.0 Flash 中的正式版功能使用动态共享配额

Gemini 2.0 Flash 中的“使用 Google 搜索进行接地”功能会受到速率限制

2.0 Flash-Lite

Gemini 2.0 Flash-Lite 是我们速度最快、性价比最高的 Flash 模型。

Gemini 2.0 Flash-Lite 包含:

  • 多模态输入、文本输出
  • 100 万个 token 输入上下文窗口
  • 8,000 个 token 输出上下文窗口

2.0 Flash-Lite 包含以下功能:

  • 多模态输出生成
  • 与 Multimodal Live API 集成
  • 思考模式
  • 内置工具使用情况

使用此模型 ID 将 Gemini 2.0 Flash-Lite 与 Gen AI SDK 搭配使用:gemini-2.0-flash-lite

2.5 Pro Experimental

Gemini 2.5 Pro Experimental 是我们最先进的推理型 Gemini 模型,尤其适用于多模态理解、编码和世界知识。 Gemini 2.5 Pro Experimental 是 Vertex AI 中的实验性模型。

Gemini 2.5 Pro Experimental 功能:

  • 思考和推理
  • 多模态输入
  • 文本输出
  • 提示优化器
  • 受控生成功能
  • 函数调用(不包括组合函数调用)
  • 使用 Google 搜索建立依据
  • 代码执行
  • 计数 token

使用此模型 ID 将 Gemini 2.5 Pro Experimental 与 Gen AI SDK 搭配使用:gemini-2.5-pro-exp-03-25

配额和限制

Gemini 2.5 Pro Experimental 在实验阶段的速率限制为每分钟 10 次查询 (QPM)。

Gemini 2.5 Pro Experimental 中的“使用 Google 搜索进行接地”功能会受到速率限制

Google Gen AI SDK

Gen AI SDK 通过 Vertex AI 上的 Gemini Developer API 和 Gemini API 为 Gemini 2.0 提供了统一接口。除了少数例外情况,在一个平台上运行的代码都会在两个平台上运行。这意味着,您可以使用 Developer API 为应用开发原型,然后将应用迁移到 Vertex AI,而无需重写代码。

该 SDK 现已以 Python 版本正式发布。对 Go 的支持目前处于预览版阶段,很快会推出对 Java 和 JavaScript 的支持。

您可以开始使用该 SDK,如下所示。

Gen AI SDK for Python

安装

pip install --upgrade google-genai
如需了解详情,请参阅 SDK 参考文档

设置环境变量以将 Gen AI SDK 与 Vertex AI 搭配使用:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=us-central1
export GOOGLE_GENAI_USE_VERTEXAI=True

from google import genai
from google.genai.types import HttpOptions

client = genai.Client(http_options=HttpOptions(api_version="v1"))
response = client.models.generate_content(
    model="gemini-2.0-flash-001",
    contents="How does AI work?",
)
print(response.text)
# Example response:
# Okay, let's break down how AI works. It's a broad field, so I'll focus on the ...
#
# Here's a simplified overview:
# ...