Gemini 2.5 Flash

2.5 Flash

Gemini 2.5 Flash는 가격과 성능 면에서 가장 우수한 모델이며 다재다능한 기능을 제공합니다. Gemini 2.5 Flash는 사고 기능을 갖춘 최초의 Flash 모델로, 이를 통해 모델이 대답을 생성할 때 거치는 사고 과정을 확인할 수 있습니다.

Vertex AI에서 사용해 보기 Model Garden에서 모델 카드 보기 (미리보기) 예시 앱 배포

참고: '예시 앱 배포' 기능을 사용하려면 결제 및 Vertex AI API가 사용 설정된 Google Cloud 프로젝트가 필요합니다.
모델 ID gemini-2.5-flash-preview-05-20
지원되는 입력 및 출력
  • 입력:
    텍스트, 코드, 이미지, 오디오, 동영상
  • 출력:
    텍스트
토큰 한도
  • 최대 입력 토큰 수: 1,048,576
  • 최대 출력 토큰 수: 65,535
기능
사용량 유형
기술 사양
이미지
  • 프롬프트당 최대 이미지 수: 3,000개
  • 최대 이미지 크기: 7MB
  • 지원되는 MIME 유형:
    image/png, image/jpeg, image/webp
문서
  • 프롬프트당 최대 파일 수: 3,000개
  • 파일당 최대 페이지 수: 1,000
  • API 또는 Cloud Storage 가져오기의 파일당 최대 파일 크기: 50MB
  • 콘솔을 통한 직접 업로드의 경우 파일당 최대 파일 크기: 7MB
  • 지원되는 MIME 유형:
    application/pdf, text/plain
동영상
  • 최대 동영상 길이 (오디오 포함): 약 45분
  • 최대 동영상 길이 (오디오 제외): 약 1시간
  • 프롬프트당 최대 동영상 수: 10개
  • 지원되는 MIME 유형:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
오디오
  • 프롬프트당 최대 오디오 길이: 약 8.4시간 또는 최대 100만 개의 토큰
  • 프롬프트당 최대 오디오 파일 수: 1
  • 음성 이해: 오디오 요약, 스크립트 작성, 번역
  • 지원되는 MIME 유형:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
매개변수 기본값
  • 온도: 0~2
  • topP: 0.95
  • topK: 64 (고정)
  • candidateCount: 1~8
지식 단절 날짜 2025년 1월
버전
  • gemini-2.5-flash-preview-05-20
    • 출시 단계: 공개 미리보기
    • 출시일: 2025년 5월 20일
  • gemini-2.5-flash-preview-04-17
    • 출시 단계: 공개 미리보기
    • 출시일: 2025년 4월 17일
지원되는 리전

모델 가용성

  • 전역
    • 전역
  • 미국
    • us-central1
자세한 내용은 데이터 상주를 참고하세요.
보안 제어
자세한 내용은 보안 제어를 참조하세요.
가격 책정 가격 책정을 참조하세요.

Live API 네이티브 오디오

Live API 네이티브 오디오가 포함된 Gemini 2.5 Flash는 Live API용 최신 네이티브 오디오 기능을 갖춘 미리보기 모델입니다. 이 미리보기 모델에는 표준 Live API 기능 외에도 다음이 포함됩니다.

  • 향상된 음질 및 적응성: Live API 네이티브 오디오는 24개 언어30개 HD 음성으로 더 풍부하고 자연스러운 음성 상호작용을 제공합니다.
  • 사전 예방적 오디오 소개: 사전 예방적 오디오가 사용 설정되면 모델은 관련성이 있을 때만 응답합니다. 이 모델은 기기에 관한 쿼리에 대해서만 사전 예방적으로 텍스트 스크립트와 오디오 응답을 생성하며 기기가 아닌 대상에 관한 쿼리에는 응답하지 않습니다.
  • 감정 대화 소개: Live API 네이티브 오디오를 사용하는 모델은 사용자의 감정 표현을 이해하고 적절하게 반응하여 더 미묘한 대화를 할 수 있습니다.

Live API에 관한 자세한 내용은 독립형 Live API 문서를 참고하세요.

Vertex AI에서 사용해 보기 (미리보기) 예시 앱 배포

참고: '예시 앱 배포' 기능을 사용하려면 결제 및 Vertex AI API가 사용 설정된 Google Cloud 프로젝트가 필요합니다.
모델 ID gemini-2.5-flash-preview-native-audio-dialog
지원되는 입력 및 출력
  • 입력:
    오디오, 동영상
  • 출력:
    텍스트, 오디오
토큰 한도
  • 최대 입력 토큰 수: 1,048,576
  • 최대 출력 토큰: 128K
기능
사용량 유형
기술 사양
동영상
  • 최대 화면 공유 길이: 약 10분
  • 지원되는 MIME 유형:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
오디오
  • 최대 대화 길이: 약 10분
  • 음성 이해: 오디오 요약, 스크립트 작성, 번역
  • 지원되는 MIME 유형:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
매개변수 기본값
  • 온도: 0~2
  • topP: 0.95
  • topK: 64 (고정)
  • candidateCount: 1~8
지식 단절 날짜 2025년 1월
버전
  • gemini-2.5-flash-preview-native-dialog
    • 출시 단계: 비공개 미리보기
    • 출시일: 2025년 5월 20일
지원되는 리전

모델 가용성

  • 미국
    • us-central1
자세한 내용은 데이터 상주를 참고하세요.
보안 제어
자세한 내용은 보안 제어를 참조하세요.
가격 책정 가격 책정을 참조하세요.