Gemini 2.5 Flash

Gemini 2.5 Flash 在价格和性能方面都是我们的最佳模型,并且提供全面的功能。Gemini 2.5 Flash 是我们的首款具备思考能力的 Flash 模型,可让您了解模型在生成回答时所经历的思考过程。

如需详细了解 Gemini 2.5 Flash 的技术信息(例如性能基准、有关训练数据集的信息、在可持续性方面的努力、预期用途和限制,以及我们在伦理和安全方面的做法),请参阅我们关于 Gemini 2.5 模型的技术报告以及 Gemini 2.5 Flash 的模型卡片

2.5 Flash

Vertex AI 中试用 模型库中查看 (预览版)部署示例应用

注意:如需使用“部署示例应用”功能,您需要拥有一个启用了结算功能和 Vertex AI API 的 Google Cloud 项目。
模型 ID gemini-2.5-flash
支持的输入和输出
  • 输入:
    文本代码图片音频视频
  • 输出:
    文本
token 数量上限
  • 输入词元数上限:1,048,576
  • 输出词元数上限:65,535(默认值)
功能
使用类型
输入大小限制 500 MB
技术规范
图片
  • 每个提示的图片数量上限: 3,000
  • 图片大小上限: 7 MB
  • 支持的 MIME 类型:
    image/pngimage/jpegimage/webp
文档
  • 每个提示的文件数量上限: 3,000
  • 每个文件的页数上限: 1,000
  • 通过 API 或 Cloud Storage 导入时,每个文件的文件大小上限: 50 MB
  • 通过控制台直接上传的每个文件的文件大小上限: 7 MB
  • 支持的 MIME 类型:
    application/pdftext/plain
视频
  • 视频时长上限(包含音频): 约 45 分钟
  • 视频时长上限(不含音频): 约 1 小时
  • 每个提示的视频数量上限: 10
  • 支持的 MIME 类型:
    video/x-flvvideo/quicktimevideo/mpegvideo/mpegsvideo/mpgvideo/mp4video/webmvideo/wmvvideo/3gpp
音频
  • 每个提示的音频长度上限: 约 8.4 小时,或最多 100 万个 token
  • 每个提示的音频文件数量上限: 1
  • 语音理解,用于: 音频摘要、转写和翻译
  • 支持的 MIME 类型:
    audio/x-aacaudio/flacaudio/mp3audio/m4aaudio/mpegaudio/mpgaaudio/mp4audio/opusaudio/pcmaudio/wavaudio/webm
形参默认值
  • 温度:0.0-2.0(默认 1.0)
  • topP:0.0-1.0(默认 0.95)
  • topK:64(固定)
  • candidateCount:1-8(默认值为 1)
支持的区域

模型可用性

(包括动态共享配额和预配吞吐量)

  • 全球
    • 全局
  • 美国
    • us-central1
    • us-east1
    • us-east4
    • us-east5
    • us-south1
    • us-west1
    • us-west4
  • 欧洲
    • europe-central2
    • europe-north1
    • europe-southwest1
    • europe-west1
    • europe-west4
    • europe-west8
    • europe-west9

ML 处理

  • 美国
    • 多区域
  • 欧洲
    • 多区域
如需了解详情,请参阅数据驻留
知识截点日期 2025 年 1 月
版本
  • gemini-2.5-flash
    • 发布阶段:正式版
    • 发布日期:2025 年 6 月 17 日
    • 停用日期:2026 年 6 月 17 日
  • gemini-live-2.5-flash
    • 发布阶段:非公开正式版
    • 发布日期:2025 年 6 月 17 日
  • gemini-2.5-flash-preview-05-20
    • 发布阶段:公开预览版
    • 发布日期:2025 年 5 月 20 日
    • 停用日期:2025 年 7 月 15 日
  • gemini-2.5-flash-preview-04-17
    • 发布阶段:公开预览版
    • 发布日期:2025 年 4 月 17 日
    • 停用日期:2025 年 7 月 15 日
安全控制
如需了解详情,请参阅安全控制
价格 请参阅价格

Live API 原生音频

Gemini 2.5 Flash 与 Live API 原生音频功能 Live API 的先进原生音频功能。除了标准的 Live API 功能之外,此预览版模型还包括:

  • 增强的语音质量和适应性:Live API 原生音频提供更丰富、更自然的语音互动,支持 24 种语言30 种高清语音
  • 推出主动音频:启用主动音频后,模型仅在相关时做出回答。该模型仅针对定向到设备的查询主动生成文本转写和音频回答,不会响应非设备定向查询。
  • 推出情感对话:使用 Live API 原生音频的模型可以理解用户的情感表达并做出适当的响应,从而实现更细致的对话。

如需详细了解 Live API,请参阅我们的独立 Live API 文档

Vertex AI 中试用

模型 ID gemini-live-2.5-flash-preview-native-audio
支持的输入和输出
  • 输入:
    音频视频
  • 输出:
    音频
token 数量上限
  • 输入词元数上限:1,048,576
  • 输出词元数上限:128K(默认)
功能
使用类型
输入大小限制 500 MB
技术规范
视频
  • 屏幕共享时长上限: 约 10 分钟
  • 支持的 MIME 类型:
    video/x-flvvideo/quicktimevideo/mpegvideo/mpegsvideo/mpgvideo/mp4video/webmvideo/wmvvideo/3gpp
音频
  • 对话时长上限: 约 10 分钟
  • 语音理解,用于: 音频摘要、转写和翻译
  • 支持的 MIME 类型:
    audio/x-aacaudio/flacaudio/mp3audio/m4aaudio/mpegaudio/mpgaaudio/mp4audio/opusaudio/pcmaudio/wavaudio/webm
形参默认值
  • 温度:0.0-2.0(默认 1.0)
  • topP:0.0-1.0(默认 0.95)
  • topK:64(固定)
  • candidateCount:1-8(默认值为 1)
支持的区域

模型可用性

  • 美国
    • us-central1
如需了解详情,请参阅数据驻留
知识截点日期 2025 年 1 月
版本
  • gemini-live-2.5-flash-preview-native-audio
    • 发布阶段:公开预览版
    • 发布日期:2025 年 6 月 17 日
安全控制
如需了解详情,请参阅安全控制
价格 请参阅价格