Gemini 2.5 Flash

2.5 Flash

Gemini 2.5 Flash 是我們在價格和效能方面表現最出色的模型,功能也十分全面。Gemini 2.5 Flash 是我們第一個具備思考能力的 Flash 模型,可讓您查看模型生成回覆時的思考過程。

Vertex AI 中試用 Model Garden 中查看模型資訊卡 (預先發布版) 部署範例應用程式

注意:如要使用「Deploy example app」(部署範例應用程式) 功能,您需要啟用帳單和 Vertex AI API 的 Google Cloud 專案。
模型 ID gemini-2.5-flash
支援的輸入和輸出
  • 輸入內容:
    文字程式碼圖片音訊影片
  • 輸出:
    文字
權杖限制
  • 輸入內容符記數量上限:1,048,576
  • 輸出內容符記數量上限:65,535 (預設)
功能
用途類型
輸入大小上限 500 MB
技術規格
圖片
  • 每個提示的圖片數量上限: 3,000 張
  • 圖片大小上限: 7 MB
  • 支援的 MIME 類型:
    image/pngimage/jpegimage/webp
文件
  • 每個提示的檔案數量上限: 3,000 個
  • 每個檔案的頁數上限: 1,000
  • 透過 API 或 Cloud Storage 匯入時,每個檔案的大小上限: 50 MB
  • 透過控制台直接上傳的檔案大小上限: 7 MB
  • 支援的 MIME 類型:
    application/pdftext/plain
影片
  • 影片長度上限 (含音訊): 約 45 分鐘
  • 影片長度上限 (不含音訊): 約 1 小時
  • 每個提示的影片數量上限: 10
  • 支援的 MIME 類型:
    video/x-flvvideo/quicktimevideo/mpegvideo/mpegsvideo/mpgvideo/mp4video/webmvideo/wmvvideo/3gpp
音訊
  • 每個提示的音訊長度上限: 約 8.4 小時,或最多 100 萬個權杖
  • 每個提示的音訊檔案數量上限: 1
  • 語音理解功能: 音訊摘要、轉錄和翻譯
  • 支援的 MIME 類型:
    audio/x-aacaudio/flacaudio/mp3audio/m4aaudio/mpegaudio/mpgaaudio/mp4audio/opusaudio/pcmaudio/wavaudio/webm
參數預設值
  • 溫度:0.0 到 2.0 (預設值為 1.0)
  • topP:0.0 到 1.0 (預設為 0.95)
  • topK:64 (固定)
  • candidateCount:1 到 8 (預設為 1)
知識截點日期 2025 年 1 月
版本
  • gemini-2.5-flash
    • 推出階段:正式發行
    • 發布日期:2025 年 6 月 17 日
    • 終止日期:2026 年 6 月 17 日
  • gemini-live-2.5-flash
    • 推出階段:私人正式發行版
    • 發布日期:2025 年 6 月 17 日
  • gemini-2.5-flash-preview-05-20
    • 推出階段:公開測試
    • 發布日期:2025 年 5 月 20 日
    • 終止日期:2025 年 7 月 15 日
  • gemini-2.5-flash-preview-04-17
    • 推出階段:公開測試
    • 發布日期:2025 年 4 月 17 日
    • 終止日期:2025 年 7 月 15 日
支援的地區

模型適用情形

  • 全球
    • 全球
  • 美國
    • us-central1
    • us-east1
    • us-east4
    • us-east5
    • us-south1
    • us-west1
    • us-west4
  • 歐洲
    • europe-central2
    • europe-north1
    • europe-southwest1
    • europe-west1
    • europe-west4
    • europe-west8
    • europe-west9

機器學習處理

  • 美國
    • 多區域
  • 歐洲
    • 多區域
詳情請參閱「資料落地」一文。
安全性控管
詳情請參閱安全控管措施
定價 請參閱定價

Live API 原生音訊

Gemini 2.5 Flash 搭配 Live API 原生音訊功能 Live API 的尖端原生音訊功能。除了標準的 Live API 功能外,這個預覽模型還包含:

  • 提升語音品質和適應性:Live API 原生音訊提供更豐富、自然的語音互動,支援 30 種 HD 語音24 種語言
  • 推出主動式語音功能:啟用主動式語音功能後,模型只會在適當的時機回覆。模型只會針對導向裝置的查詢主動生成文字轉錄稿和音訊回覆,不會回覆非導向裝置的查詢。
  • 推出情感對話:模型使用 Live API 原生音訊,可理解使用者的情緒表達並適當回應,讓對話更細膩。

如要進一步瞭解 Live API,請參閱獨立的 Live API 說明文件

Vertex AI 中試用

模型 ID gemini-live-2.5-flash-preview-native-audio
支援的輸入和輸出
  • 輸入:
    音訊影片
  • 輸出內容:
    文字音訊
權杖限制
  • 輸入內容符記數量上限:1,048,576
  • 輸出內容符記數量上限:128,000 個 (預設)
功能
用途類型
輸入大小上限 500 MB
技術規格
影片
  • 螢幕分享時間上限: 約 10 分鐘
  • 支援的 MIME 類型:
    video/x-flvvideo/quicktimevideo/mpegvideo/mpegsvideo/mpgvideo/mp4video/webmvideo/wmvvideo/3gpp
音訊
  • 對話長度上限: 約 10 分鐘
  • 語音理解功能: 音訊摘要、轉錄和翻譯
  • 支援的 MIME 類型:
    audio/x-aacaudio/flacaudio/mp3audio/m4aaudio/mpegaudio/mpgaaudio/mp4audio/opusaudio/pcmaudio/wavaudio/webm
參數預設值
  • 溫度:0.0 到 2.0 (預設值為 1.0)
  • topP:0.0 到 1.0 (預設為 0.95)
  • topK:64 (固定)
  • candidateCount:1 到 8 (預設為 1)
知識截點日期 2025 年 1 月
版本
  • gemini-live-2.5-flash-preview-native-audio
    • 推出階段:公開測試
    • 發布日期:2025 年 6 月 17 日
支援的地區

模型適用情形

  • 美國
    • us-central1
詳情請參閱「資料落地」一文。
安全性控管
詳情請參閱安全控管措施
定價 請參閱定價