Gemini 2.5 Flash 在价格和性能方面都是我们的最佳模型,并且提供全面的功能。Gemini 2.5 Flash 是我们的首款具备思考能力的 Flash 模型,可让您了解模型在生成回答时所经历的思考过程。
如需详细了解 Gemini 2.5 Flash 的技术信息(例如性能基准、有关训练数据集的信息、在可持续性方面的努力、预期用途和限制,以及我们在伦理和安全方面的做法),请参阅我们关于 Gemini 2.5 模型的技术报告以及 Gemini 2.5 Flash 的模型卡片。
2.5 Flash
在 Vertex AI 中试用 在模型库中查看 (预览版)部署示例应用
模型 ID | gemini-2.5-flash |
|
---|---|---|
支持的输入和输出 |
|
|
token 数量上限 |
|
|
功能 | ||
使用类型 | ||
输入大小限制 | 500 MB | |
技术规范 | ||
图片 |
|
|
文档 |
|
|
视频 |
|
|
音频 |
|
|
形参默认值 |
|
|
支持的区域 | ||
模型可用性 (包括动态共享配额和预配吞吐量) |
|
|
ML 处理 |
|
|
如需了解详情,请参阅数据驻留。 | ||
知识截点日期 | 2025 年 1 月 | |
版本 |
|
|
安全控制 | ||
如需了解详情,请参阅安全控制。 | ||
价格 | 请参阅价格。 |
Live API 原生音频
Gemini 2.5 Flash 与 Live API 原生音频功能 Live API 的先进原生音频功能。除了标准的 Live API 功能之外,此预览版模型还包括:
- 增强的语音质量和适应性:Live API 原生音频提供更丰富、更自然的语音互动,支持 24 种语言的 30 种高清语音。
- 推出主动音频:启用主动音频后,模型仅在相关时做出回答。该模型仅针对定向到设备的查询主动生成文本转写和音频回答,不会响应非设备定向查询。
- 推出情感对话:使用 Live API 原生音频的模型可以理解用户的情感表达并做出适当的响应,从而实现更细致的对话。
如需详细了解 Live API,请参阅我们的独立 Live API 文档。
模型 ID | gemini-live-2.5-flash-preview-native-audio |
|
---|---|---|
支持的输入和输出 |
|
|
token 数量上限 |
|
|
功能 | ||
使用类型 | ||
输入大小限制 | 500 MB | |
技术规范 | ||
视频 |
|
|
音频 |
|
|
形参默认值 |
|
|
支持的区域 | ||
模型可用性 |
|
|
如需了解详情,请参阅数据驻留。 | ||
知识截点日期 | 2025 年 1 月 | |
版本 |
|
|
安全控制 | ||
如需了解详情,请参阅安全控制。 | ||
价格 | 请参阅价格。 |