Gemini 2.5 Flash

2.5 Flash

Gemini 2.5 Flash は、価格とパフォーマンスの面で最高のモデルであり、バランスの取れた機能を提供します。Gemini 2.5 Flash は、思考能力を備えた初の Flash モデルです。これにより、モデルが回答を生成する際の思考プロセスを確認できます。

Vertex AI で試す Model Garden でモデルカードを表示する (プレビュー)サンプルアプリをデプロイする

注: 「サンプルアプリをデプロイする」機能を使用するには、課金と Vertex AI API が有効になっている Google Cloud プロジェクトが必要です。
モデル ID gemini-2.5-flash
サポートされている入出力
  • 入力:
    テキストコード画像音声動画
  • 出力:
    テキスト
トークンの上限
  • 最大入力トークン: 1,048,576
  • 最大出力トークン: 65,535(デフォルト)
機能
使用タイプ
入力サイズの上限 500 MB
技術仕様
画像
  • プロンプトあたりの最大画像数: 3,000
  • 画像の最大サイズ: 7 MB
  • サポートされている MIME タイプ:
    image/pngimage/jpegimage/webp
ドキュメント
  • プロンプトあたりの最大ファイル数: 3,000
  • ファイルあたりの最大ページ数: 1,000
  • API または Cloud Storage のインポートのファイルあたりの最大ファイルサイズ: 50 MB
  • コンソールから直接アップロードする場合のファイルあたりの最大ファイルサイズ: 7 MB
  • サポートされている MIME タイプ:
    application/pdftext/plain
動画
  • 動画の最大長(音声あり): 約 45 分
  • 動画の長さの上限(音声なし): 約 1 時間
  • プロンプトあたりの動画の最大数: 10
  • サポートされている MIME タイプ:
    video/x-flvvideo/quicktimevideo/mpegvideo/mpegsvideo/mpgvideo/mp4video/webmvideo/wmvvideo/3gpp
音声
  • プロンプトあたりの音声の最大長: 約 8.4 時間、または最大 100 万トークン
  • プロンプトあたりの音声ファイルの最大数: 1
  • 音声理解(音声の要約、文字起こし、翻訳)
  • サポートされている MIME タイプ:
    audio/x-aacaudio/flacaudio/mp3audio/m4aaudio/mpegaudio/mpgaaudio/mp4audio/opusaudio/pcmaudio/wavaudio/webm
パラメータのデフォルト
  • 温度: 0.0 ~ 2.0(デフォルトは 1.0)
  • topP: 0.0 ~ 1.0(デフォルトは 0.95)
  • topK: 64(固定)
  • candidateCount: 1 ~ 8(デフォルトは 1)
ナレッジ カットオフ日 2025 年 1 月
バージョン
  • gemini-2.5-flash
    • リリース ステージ: 一般提供
    • リリース日: 2025 年 6 月 17 日
    • 提供終了日: 2026 年 6 月 17 日
  • gemini-live-2.5-flash
    • リリース ステージ: 限定公開 GA
    • リリース日: 2025 年 6 月 17 日
  • gemini-2.5-flash-preview-05-20
    • リリース ステージ: パブリック プレビュー
    • リリース日: 2025 年 5 月 20 日
    • 提供終了日: 2025 年 7 月 15 日
  • gemini-2.5-flash-preview-04-17
    • リリース ステージ: パブリック プレビュー
    • リリース日: 2025 年 4 月 17 日
    • 提供終了日: 2025 年 7 月 15 日
サポートされるリージョン

モデルの可用性

  • グローバル
    • global
  • 米国
    • us-central1
    • us-east1
    • us-east4
    • us-east5
    • us-south1
    • us-west1
    • us-west4
  • ヨーロッパ
    • europe-central2
    • europe-north1
    • europe-southwest1
    • europe-west1
    • europe-west4
    • europe-west8
    • europe-west9

ML 処理

  • 米国
    • マルチリージョン
  • ヨーロッパ
    • マルチリージョン
詳細については、データ所在地をご覧ください。
セキュリティ管理
詳細については、セキュリティ管理をご覧ください。
料金 料金をご覧ください。

Live API ネイティブ オーディオ

Gemini 2.5 Flash と Live API のネイティブ音声機能は、Live API の最先端のネイティブ音声機能です。このプレビュー モデルには、標準の Live API 機能に加えて、次の機能が含まれています。

  • 音声品質と適応性の向上: Live API ネイティブ音声により、24 言語30 種類の HD 音声で、より豊かで自然な音声インタラクションを実現します。
  • プロアクティブ音声の導入: プロアクティブ音声が有効になっている場合、モデルは関連性がある場合にのみ応答します。モデルは、デバイス指向のクエリに対してのみテキスト文字起こしと音声応答をプロアクティブに生成し、デバイス指向以外のクエリには応答しません。
  • 感情的なダイアログの導入: Live API ネイティブ音声を使用するモデルは、ユーザーの感情表現を理解して適切に応答し、よりニュアンスのある会話を実現できます。

Live API の詳細については、スタンドアロンの Live API ドキュメントをご覧ください。

Vertex AI で試す

モデル ID gemini-live-2.5-flash-preview-native-audio
サポートされている入出力
  • 入力:
    音声動画
  • 出力:
    テキスト音声
トークンの上限
  • 最大入力トークン: 1,048,576
  • 最大出力トークン: 128,000(デフォルト)
機能
使用タイプ
入力サイズの上限 500 MB
技術仕様
動画
  • 画面共有の最大時間: 約 10 分
  • サポートされている MIME タイプ:
    video/x-flvvideo/quicktimevideo/mpegvideo/mpegsvideo/mpgvideo/mp4video/webmvideo/wmvvideo/3gpp
音声
  • 会話の最大長: 約 10 分
  • 音声理解(音声の要約、文字起こし、翻訳)
  • サポートされている MIME タイプ:
    audio/x-aacaudio/flacaudio/mp3audio/m4aaudio/mpegaudio/mpgaaudio/mp4audio/opusaudio/pcmaudio/wavaudio/webm
パラメータのデフォルト
  • 温度: 0.0 ~ 2.0(デフォルトは 1.0)
  • topP: 0.0 ~ 1.0(デフォルトは 0.95)
  • topK: 64(固定)
  • candidateCount: 1 ~ 8(デフォルトは 1)
ナレッジ カットオフ日 2025 年 1 月
バージョン
  • gemini-live-2.5-flash-preview-native-audio
    • リリース ステージ: パブリック プレビュー
    • リリース日: 2025 年 6 月 17 日
サポートされるリージョン

モデルの可用性

  • 米国
    • us-central1
詳細については、データ所在地をご覧ください。
セキュリティ管理
詳細については、セキュリティ管理をご覧ください。
料金 料金をご覧ください。