Gemini 2.5 Flash

注意：gemini-2.0-flash-preview-image-generation 和 gemini-2.5-flash-image-preview 模型将于 2025 年 10 月 31 日停用。请务必在该日期之前将所有工作流迁移到 gemini-2.5-flash-image，以免服务中断。

Gemini 2.5 Flash 在价格和性能方面都是我们的最佳模型，并且提供全面的功能。Gemini 2.5 Flash 是我们的首款具备思考能力的 Flash 模型，可让您了解模型在生成回答时所经历的思考过程。

如需详细了解 Gemini 2.5 Flash 的技术信息（例如性能基准、有关训练数据集的信息、在可持续性方面的努力、预期用途和限制，以及我们在伦理和安全方面的做法），请参阅我们关于 Gemini 2.5 模型的技术报告以及 Gemini 2.5 Flash 的模型卡片。

2.5 Flash

在 Vertex AI 中试用在 Model Garden 中查看（预览版）部署示例应用

注意：如需使用“部署示例应用”功能，您需要拥有一个启用了结算功能和 Vertex AI API 的 Google Cloud 项目。

技术规范
模型 ID	`gemini-2.5-flash`
支持的输入和输出	输入：文本、代码、图片、音频、视频输出：文本
token 数量上限	输入词元数上限：1,048,576 输出词元数上限：65,535（默认值）
功能	支持使用 Google 搜索建立依据代码执行调优系统指令结构化输出函数调用统计 token 数量 Live API 预览版功能思考型 Vertex AI RAG 引擎聊天补全不支持
使用类型	支持预配吞吐量动态共享配额批量预测不支持固定配额
输入大小限制	500 MB
	图片	每个提示的图片数量上限： 3,000 图片大小上限：7 MB 支持的 MIME 类型： `image/png`、`image/jpeg`、`image/webp`
	文档	每个提示的文件数量上限： 3,000 每个文件的页数上限：1,000 通过 API 或 Cloud Storage 导入时，每个文件的文件大小上限：50 MB 通过控制台直接上传的每个文件的文件大小上限：7 MB 支持的 MIME 类型： `application/pdf`、`text/plain`
	视频	视频时长上限（包含音频）：约 45 分钟视频时长上限（不含音频）：约 1 小时每个提示的视频数量上限：10 支持的 MIME 类型： `video/x-flv`、`video/quicktime`、`video/mpeg`、`video/mpegs`、`video/mpg`、`video/mp4`、`video/webm`、`video/wmv`、`video/3gpp`
	音频	每个提示的音频时长上限：约 8.4 小时或最多 100 万个 token 每个提示的音频文件数量上限： 1 语音理解，用于：音频摘要、转写和翻译支持的 MIME 类型： `audio/x-aac`、`audio/flac`、`audio/mp3`、`audio/m4a`、`audio/mpeg`、`audio/mpga`、`audio/mp4`、`audio/ogg`、`audio/pcm`、`audio/wav`、`audio/webm`
	参数默认值	温度：0.0-2.0（默认值为 1.0） topP：0.0-1.0（默认值为 0.95） topK：64（固定值） candidateCount：1-8（默认值为 1）
支持的区域
	模型可用性（包括动态共享配额和预配吞吐量）	全球全局美国 us-central1 us-east1 us-east4 us-east5 us-south1 us-west1 us-west4 欧洲 europe-central2 europe-north1 europe-southwest1 europe-west1 europe-west4 europe-west8
	ML 处理	美国多区域加拿大 northamerica-northeast1⁺ 欧洲多区域 europe-west2^{* +} europe-west3^{* +} europe-west9^{* +} 亚太地区 asia-northeast1^{* +} asia-northeast3^{* +} asia-south1^{* +} asia-southeast1⁺ australia-southeast1^{* +}
	如需了解详情，请参阅数据驻留。
知识截点日期	2025 年 1 月
版本	`gemini-2.5-flash` 发布阶段：正式版发布日期：2025 年 6 月 17 日终止日期：2026 年 6 月 17 日 `gemini-live-2.5-flash` 发布阶段：非公开正式版发布日期：2025 年 6 月 17 日
安全控制
安全控制	如需了解详情，请参阅安全控制。
支持的语言	请参阅支持的语言。
价格	请参阅价格。

+ 不支持监督式微调
* 仅适用于 128K 上下文窗口，不支持监督式微调

2.5 Flash

在 Vertex AI 中试用（预览版）部署示例应用

注意：如需使用“部署示例应用”功能，您需要拥有一个启用了结算功能和 Vertex AI API 的 Google Cloud 项目。

技术规范
模型 ID	`gemini-2.5-flash-preview-09-2025`
支持的输入和输出	输入：文本、代码、图片、音频、视频输出：文本
token 数量上限	输入词元数上限：1,048,576 输出词元数上限：65,535（默认值）
功能	支持使用 Google 搜索建立依据代码执行系统指令结构化输出函数调用统计 token 数量 Live API 预览版功能思考型 Vertex AI RAG 引擎聊天补全不支持调优
使用类型	支持预配吞吐量动态共享配额不支持固定配额批量预测
	图片	每个提示的图片数量上限： 3,000 图片大小上限：7 MB 支持的 MIME 类型： `image/png`、`image/jpeg`、`image/webp`
	文档	每个提示的文件数量上限： 3,000 每个文件的页数上限：1,000 通过 API 或 Cloud Storage 导入时，每个文件的文件大小上限：50 MB 通过控制台直接上传的每个文件的文件大小上限：7 MB 支持的 MIME 类型： `application/pdf`、`text/plain`
	视频	视频时长上限（包含音频）：约 45 分钟视频时长上限（不含音频）：约 1 小时每个提示的视频数量上限：10 支持的 MIME 类型： `video/x-flv`、`video/quicktime`、`video/mpeg`、`video/mpegs`、`video/mpg`、`video/mp4`、`video/webm`、`video/wmv`、`video/3gpp`
	音频	每个提示的音频时长上限：约 8.4 小时或最多 100 万个 token 每个提示的音频文件数量上限： 1 语音理解，用于：音频摘要、转写和翻译支持的 MIME 类型： `audio/x-aac`、`audio/flac`、`audio/mp3`、`audio/m4a`、`audio/mpeg`、`audio/mpga`、`audio/mp4`、`audio/ogg`、`audio/pcm`、`audio/wav`、`audio/webm`
	参数默认值	温度：0.0-2.0（默认值为 1.0） topP：0.0-1.0（默认值为 0.95） topK：64（固定值） candidateCount：1-8（默认值为 1）
支持的区域
	模型可用性（包括动态共享配额和预配吞吐量）	全球全局
	如需了解详情，请参阅数据驻留。
知识截点日期	2025 年 1 月
版本	`gemini-2.5-flash-preview-09-2025` 发布阶段：公开预览版发布日期：2025 年 9 月 25 日
安全控制
安全控制	如需了解详情，请参阅安全控制。
支持的语言	请参阅支持的语言。
价格	请参阅价格。

图片

在 Vertex AI 中试用（预览版）部署示例应用

注意：如需使用“部署示例应用”功能，您需要拥有一个启用了结算功能和 Vertex AI API 的 Google Cloud 项目。

技术规范
模型 ID	`gemini-2.5-flash-image`
支持的输入和输出	输入：文本、图片输出：文本和图片
token 数量上限	输入 token 数量上限：32,768 输出 token 数上限：32,768
功能	支持系统指令统计 token 数量不支持使用 Google 搜索建立依据代码执行调优函数调用 Live API 预览版功能思考型 Vertex AI RAG 引擎聊天补全
使用类型	支持预配吞吐量动态共享配额批量预测不支持固定配额
输入大小限制	500 MB
	图片	每个提示的图片数量上限：3 图片大小上限： 7 MB 每个提示的输出图片数量上限： 10 支持的宽高比：1:1、3:2、2:3、3:4、4:3、4:5、5:4、9:16、16:9 和 21:9 支持的 MIME 类型： `image/png`、 `image/jpeg`、 `image/webp`
	文档	每个提示的文件数量上限：3 每个文件的页数上限：3 每个文件的文件大小上限： 50 MB（通过 API 和 Cloud Storage 导入）或 7 MB（通过 Google Cloud 控制台直接上传）支持的 MIME 类型： `application/pdf`、 `text/plain`
	参数默认值	温度：0.0-2.0（默认值为 1.0） topP：0.0-1.0（默认值为 0.95） topK：64（固定值） candidateCount：1-8（默认值为 1）
支持的区域
	模型可用性（包括动态共享配额和预配吞吐量）	全球全局美国 us-central1 us-east1 us-east4 us-east5 us-south1 us-west1 us-west4 欧洲 europe-central2 europe-north1 europe-southwest1 europe-west1 europe-west4 europe-west8
	ML 处理	美国多区域欧洲多区域
	如需了解详情，请参阅数据驻留。
知识截点日期	2025 年 6 月
版本	`gemini-2.5-flash-image` 发布阶段：正式版发布日期：2025 年 10 月 2 日 `gemini-2.5-flash-image-preview` 发布阶段：公开预览版发布日期：2025 年 8 月 26 日终止日期：2025 年 10 月 31 日
安全控制
安全控制	如需了解详情，请参阅安全控制。
支持的语言	请参阅支持的语言。
价格	请参阅价格。

Live API 原生音频

带有 Live API 原生音频的 Gemini 2.5 Flash 具有我们针对 Live API 的先进原生音频功能。除了标准 Live API 功能之外，此预览版模型还包括：

增强的音质：体验大幅提升的音质，仿佛在与真人对话。
增强的语音质量和适应性：Live API 原生音频提供更丰富、更自然的语音互动，支持 24 种语言的 30 种高清语音。
推出主动音频：启用主动音频后，模型仅在相关时做出回答。该模型仅针对定向到设备的查询主动生成文本转写和音频回答，不会回答非定向到设备的查询。
推出共情对话：使用 Live API 原生音频的模型可以理解用户的情感表达并做出适当响应，从而实现更细致的对话。
改进了打断功能：即使在嘈杂的环境中，也能更自然、更可靠地打断 Gemini。
强大的函数调用：我们提高了触发率，使 Gemini 能够成功执行您定义的函数，从而支持您的应用场景。
准确的转写：音频转文字的转写准确性已得到显著提升。
顺畅的多语言支持：您可以使用多种语言与 Gemini 对话，它会毫不费力地在这些语言之间切换，无需任何预配置。语言不再是障碍。

如需详细了解 Live API，请参阅：

在 Vertex AI 中试用

技术规范
模型 ID	`gemini-live-2.5-flash-preview-native-audio-09-2025`
支持的输入和输出	输入：文本、音频、视频输出：文本、音频
token 数量上限	输入 token 数上限：12.8 万个输出 token 数上限：6.4 万个上下文窗口：3.2 万个 token（默认），可升级到 12.8 万个 token
功能	支持使用 Google 搜索建立依据系统指令函数调用 Live API 预览版功能不支持代码执行调优结构化输出思考型 Vertex AI RAG 引擎聊天补全
使用类型	支持最多 1,000 个并发会话不支持预配吞吐量动态共享配额批量预测
	视频	标准分辨率：768 x 768 支持的 MIME 类型： `video/x-flv`、`video/quicktime`、`video/mpeg`、`video/mpegs`、`video/mpg`、`video/mp4`、`video/webm`、`video/wmv`、`video/3gpp`
	音频	对话时长上限：默认时长为 10 分钟，可延长。所需的音频输入格式：16 kHz 的原始 16 位 PCM 音频，小端字节序所需的音频输出格式：24 kHz 原始 16 位 PCM 音频，小端字节序支持的 MIME 类型： `audio/x-aac`、 `audio/flac`、 `audio/mp3`、 `audio/m4a`、 `audio/mpeg`、 `audio/mpga`、 `audio/mp4`、 `audio/ogg`、 `audio/pcm`、 `audio/wav`、 `audio/webm`
	参数默认值	开始语音识别的灵敏度：低结束语音识别的灵敏度：高前缀内边距：0 上下文大小上限：128,000
支持的区域
	模型可用性	美国 us-central1
	如需了解详情，请参阅数据驻留。
知识截点日期	2025 年 1 月
版本	`gemini-live-2.5-flash-preview-native-audio-09-17` 发布阶段：公开预览版发行日期：2025 年 9 月 18 日 `gemini-live-2.5-flash-preview-native-audio` 发布阶段：公开预览版发布日期：2025 年 6 月 17 日终止日期：2025 年 10 月 18 日
安全控制
安全控制	如需了解详情，请参阅安全控制。
支持的语言	请参阅支持的语言。
价格	请参阅价格。

Gemini 2.5 Flash 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

2.5 Flash

2.5 Flash

图片

Live API 原生音频

Gemini 2.5 Flash