Vertex AI에서 AI 모델을 빌드하고 배포하는 비용
가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
이 페이지에서는 Vertex AI의 생성형 AI 가격 책정을 설명합니다. ML Platform 및 MLOps 서비스 등 다른 모든 Vertex AI 가격 책정은 Vertex AI 가격 책정 페이지를 참조하세요.
Google 모델
Gemini 2.5
모델 | 유형 | 가격 (/100만 토큰) <= 20만 입력 토큰 | 가격 (/100만 토큰) > 20만 입력 토큰 |
---|---|---|---|
Gemini 2.5 Pro | |||
입력 (텍스트, 이미지, 동영상, 오디오) | $1.25 | $2.5 | |
텍스트 출력 (응답 및 근거) | $10 | $15 | |
Gemini 2.5 Flash | |||
입력 (텍스트, 이미지, 동영상) | $0.15 | $0.15 | |
오디오 입력 | $1 | $1 | |
텍스트 출력 (생각 없음) | $0.60 | $0.60 | |
텍스트 출력 (사고-응답 및 추론) | $3.50 | $3.50 |
Gemini 2.0
Gemini 2.0은 토큰을 기준으로 청구됩니다. 요청을 전송하기 전에 요청에 포함된 입력 토큰 수를 계산하려면 SDK 토크나이저 또는 countTokens API를 사용할 수 있습니다. 요청이 400 또는 500 오류로 실패하면 사용한 토큰에 대한 요금이 청구되지 않습니다.
가격표의 전환 버튼을 사용해 토큰 기반 가격 책정과 모드 기반 가격 책정을 비교하세요.
토큰 기반 가격 책정
모델 | 유형 | 가격 | Batch API를 사용한 가격 책정 |
---|---|---|---|
Gemini 2.0 Flash |
|||
입력 토큰 100만 개 | $0.15 | $0.075 | |
입력 오디오 토큰 100만 개 | $1.00 | $0.50 | |
출력 텍스트 토큰 100만 개 | $0.60 | $0.30 | |
100만 개의 학습 토큰에 맞게 조정 | $3.00 | ||
Gemini 2.0 Flash Live API |
|||
입력 텍스트 토큰 100만 개 | $0.5 | ||
입력 오디오 토큰 100만 개 | $3 | ||
입력 동영상 토큰 100만 개 | $3 | ||
출력 텍스트 토큰 100만 개 | $2 | ||
출력 오디오 토큰 100만 개 | $12 | ||
Gemini 2.0 Flash Lite |
|||
입력 토큰 100만 개 | $0.075 | $0.0375 | |
입력 오디오 토큰 100만 개 | $0.075 | $0.0375 | |
출력 텍스트 토큰 100만 개 | $0.30 | $0.15 | |
100만 개의 학습 토큰에 맞게 조정 | $1.00 | ||
Google 검색으로 그라운딩 |
Gemini 2.0 Flash에는 추가 요금 없이 하루 최대 1,500건의 지상 요청이 포함됩니다. Grounded 요청이 하루 1,500개를 초과하면 요청 1,000개당 35달러의 요금이 청구됩니다 (하루 최대 100만 개 요청). 하루에 100만 개 이상의 요청이 필요한 경우 계정팀에 문의하세요. |
||
데이터로 그라운딩 | 2025년 6월 16일부터 요청 1,000개당 $2.5 청구 | ||
엔터프라이즈를 위한 웹 그라운딩 |
2025년 5월 5일부터 요청 1,000개당 $45 (하루 최대 100만 개 요청). 하루에 100만 개 이상의 요청이 필요한 경우 계정팀에 문의하세요. |
형식 기반 가격 책정
아래의 모드별 가격은 평균 사용 사례를 기준으로 하며 참고용입니다. 실제 청구는 토큰만 기준으로 이루어집니다.
- 4자(영문 기준)는 공백을 포함하여 약 1개의 텍스트 토큰이 됩니다.
- 1024x1024 이미지의 경우 1290개의 토큰을 사용합니다. 이미지당 토큰 수는 이미지 해상도에 따라 다릅니다. 토큰 계산 방법에 대한 자세한 내용은 문서를 참조하세요.
- 동영상 입력은 초당 프레임 수 1의 샘플 속도에서 초당 258개의 토큰을 소비합니다. 동영상 토큰과 오디오 토큰 모두에 대한 오디오 청구가 포함된 동영상
- 오디오 입력은 타임스탬프 없이 초당 25개의 토큰을 소비합니다.
모델 | 유형 | 가격 | Batch API를 사용한 가격 책정 |
---|---|---|---|
Gemini 2.0 Flash |
|||
입력 텍스트 ($/M자) | $0.0375 | $0.01875 | |
이미지 입력 ($/이미지) | $0.0001935 | $0.00009675 | |
동영상 입력 ($/초) | $0.0000387 | $0.00001935 | |
입력 오디오 ($/초) | $0.000025 | $0.0000125 | |
출력 텍스트 ($/M 문자) | $0.15 | $0.075 | |
Gemini 2.0 Flash Lite |
|||
입력 텍스트 ($/M자) | $0.01875 | $0.009375 | |
이미지 입력 ($/이미지) | $0.00009675 | $0.000048375 | |
동영상 입력 ($/초) | $0.00001935 | $0.000009675 | |
입력 오디오 ($/초) | $0.000001875 | $0.000000938 | |
출력 텍스트 ($/M 문자) | $0.075 | $0.0375 | |
Google 검색으로 그라운딩 |
Gemini 2.0 Flash에는 추가 요금 없이 하루 최대 1,500건의 지상 요청이 포함됩니다. Grounded 요청이 하루 1,500개를 초과하면 요청 1,000개당 35달러의 요금이 청구됩니다 (하루 최대 100만 개 요청). 하루에 100만 개 이상의 요청이 필요한 경우 계정팀에 문의하세요. |
||
엔터프라이즈를 위한 웹 그라운딩 |
2025년 5월 5일부터 요청 1,000개당 $45 (하루 최대 100만 개 요청). 하루에 100만 개 이상의 요청이 필요한 경우 계정팀에 문의하세요. |
* 가격은 미국 달러 (USD)로 표기됩니다.
USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
* PDF는 이미지 입력으로 청구되며, PDF 페이지 1개는 이미지 1개에 해당합니다.
* 조정된 모델 엔드포인트의 예측 가격은 기본 모델과 동일합니다.
* Google 검색을 통한 그라운딩은 웹에서 그라운딩 지원 URL이 하나 이상 포함된 결과를 반환하는 요청에 대해서만 청구됩니다. 표준 Gemini 모델 사용료도 적용됩니다.
* Gemini 2.0 Flash Live API: 오디오 (입력/출력) 1초당 25개 토큰, 동영상 (입력) 1초당 258개 토큰 Gemini 2.0 Flash Live API가 프리뷰 버전인 동안에는 Google 검색을 사용한 그라운딩이 계속 무료로 제공됩니다.
Vertex AI 모델 최적화 도구 가격 책정 (실험적 기능)*
Vertex AI Model Optimizer는 Gemini 모델 요청을 위한 단일 메타 엔드포인트를 제공하여 엔터프라이즈 고객의 Gemini 사용을 간소화합니다. 이 서비스를 사용하는 고객은 Flash, Pro 또는 특정 버전을 사용할지 여부를 지정할 필요가 없습니다. 대신 개발자는 선호도를 나타내는 구성 가능한 설정 (비용, 품질 또는 균형)을 제공하기만 하면 됩니다. 그러면 Model Optimizer가 각 쿼리를 가장 적합한 모델로 전송하여 작업에 적합한 수준의 인텔리전스를 적용합니다.
Vertex AI 모델 옵티마이저가 동적 가격 책정을 적용합니다. 즉, 토큰당 평균 가격은 태스크를 완료하기 위해 적용된 모델 인텔리전스 수준에 따라 달라집니다. 이러한 이유로 아래에는 구성 설정에 따른 가능한 시나리오를 보여주는 가격 책정 예시가 제공됩니다 (아래 표 참고). 모델 최적화 SKU는 $1 SKU로 결제에 적용되는 구매 단위로 사용되며, 모델을 사용한 후에도 계속 사용량 기준으로 청구됩니다.
5:1 I/O 비율 | 예시 1 채팅 봇 |
참고: 이 범위는 보장된 것이 아니며 고객별 결과는 다를 수 있습니다. | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
고객 선호도 | 고객 입력 토큰이 MO로 전송됨 | 고객 출력 토큰이 MO로 전송됨 | 토큰 100만 개당 평균 입력 가격 (상한) | 토큰 100만 개당 평균 출력 가격 (상한) | 토큰 100만 개당 평균 입력 가격 (하한가) | 토큰 100만 개당 평균 출력 가격 (하한가) | |||||
비용 | 10,000,000 | 2,000,000 | $0.63 | $2.50 | $0.16 | $0.63 | |||||
균형 | 10,000,000 | 2,000,000 | $1.26 | $5.00 | $0.63 | $2.50 | |||||
품질 | 10,000,000 | 2,000,000 | $1.89(약) | $7.50 | $1.26 | $5.00 |
1:20 I/O 비율 | 예시 2 콘텐츠 생성 | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
고객 선호도 | 고객 입력 토큰이 MO로 전송됨 | 고객 출력 토큰이 MO로 전송됨 | 토큰 100만 개당 평균 입력 가격 (상한) | 토큰 100만 개당 평균 출력 가격 (상한) | 토큰 100만 개당 평균 입력 가격 (하한가) | 토큰 100만 개당 평균 출력 가격 (하한가) | |||||
비용 | 1,000,000 | 20,000,000 | $0.63 | $2.50 | $0.16 | $0.63 | |||||
균형 | 1,000,000 | 20,000,000 | $1.26 | $5.00 | $0.63 | $2.50 | |||||
품질 | 1,000,000 | 20,000,000 | $1.89(약) | $7.50 | $1.26 | $5.00 |
기타 Gemini 모델
Gemini 2.0을 제외한 모든 Gemini 모델은 문자, 이미지, 동영상/오디오 초와 같은 모드에 따라 요금이 청구됩니다. 텍스트 입력은 입력 (프롬프트) 1,000자 및 출력 (응답) 1,000자마다 요금이 청구됩니다. 문자는 UTF-8 코드 포인트로 계산되며 공백은 개수에서 제외되므로 토큰당 약 4개의 문자가 됩니다. 필터링된 응답으로 이어지는 예측 요청은 입력에 대한 요금만 청구됩니다. 결제 주기가 끝날 때마다 1센트 ($0.01)의 분수가 1센트로 반올림됩니다. 미디어 입력은 이미지 또는 초당 (동영상) 요금이 청구됩니다. 요청이 실패하여 400 또는 500 오류가 발생하는 경우 사용된 토큰에 대한 요금이 청구되지 않습니다.
모델 | 기능 | 유형 | 가격 ( =< 128K 입력 토큰) |
가격 (128,000개 이상의 입력 토큰) |
||
---|---|---|---|---|---|---|
Gemini 1.5 Flash | 멀티모달 | 이미지 입력 동영상 입력 텍스트 입력 오디오 입력 |
$0.00002 / 이미지 $0.00002 / 초 $0.00001875 / 1,000자 $0.000002 / 초 |
$0.00004 / 이미지 $0.00004 / 초 $0.0000375 / 1,000자 $0.000004 / 초 |
||
텍스트 출력 | $0.000075 / 1,000자 | 1,000자당 $0.00015 | ||||
조정* | 학습 토큰 | 토큰 100만 개당 $8 | ||||
Gemini 1.5 Pro | 멀티모달 | 이미지 입력 동영상 입력 텍스트 입력 오디오 입력 |
$0.00032875 / 이미지 $0.00032875 / 초 $0.0003125 / 1,000자 $0.00003125 / 초 |
$0.0006575 / 이미지 $0.0006575 / 초 $0.000625 / 1,000자 $0.0000625 / 초 |
||
텍스트 출력 | $0.00125 / 1,000자 | 1,000자당 $0.0025 | ||||
조정* | 학습 토큰 | 토큰 100만 개당 $80 | ||||
Gemini 1.0 Pro | 멀티모달 | 이미지 입력 동영상 입력 텍스트 입력 |
$0.0025/이미지 $0.002/초 $0.000125/1,000자 |
|||
텍스트 출력 | $0.000375/1000자 | |||||
Google 검색을 사용하는 그라운딩 | 텍스트 | 근거 요청 | 요청 1,000개당 $35 (하루 최대 100만 개 요청). 하루에 100만 개 이상의 요청이 필요한 경우 계정팀에 문의하세요. |
|||
엔터프라이즈용 웹 그라운딩 | 텍스트 | 2025년 5월 5일부터 요청 1,000개당 $45 (하루 최대 100만 개 요청). 하루에 100만 개 이상의 요청이 필요한 경우 계정팀에 문의하세요. |
||||
데이터로 그라운딩 | 텍스트 | 2025년 6월 16일부터 요청 1,000개당 2.5달러 |
* 가격은 미국 달러 (USD)로 표기됩니다.
USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
* 쿼리 컨텍스트가 128, 000개를 초과하는 경우 모든 토큰에 긴 컨텍스트 요금이 적용됩니다.
* Gemini 모델은 일괄 모드에서 50% 할인된 가격으로 사용할 수 있습니다.
* Gemini 1.0 Pro는 최대 32K 컨텍스트 창만 지원합니다.
* PDF는 이미지 입력으로 청구되며, PDF 페이지 1개는 이미지 1개에 해당합니다.
* 조정된 모델 엔드포인트의 예측 가격은 기본 모델과 동일합니다.
* Google 검색을 이용한 그라운딩: 동적 검색을 사용하여 비용을 최적화하는 경우 응답에 웹의 그라운딩 지원 URL이 하나 이상 포함된 요청에 대해서만 Google 검색을 이용한 그라운딩 비용이 청구됩니다. Gemini에 대한 비용은 항상 청구됩니다.
Imagen
Vertex AI 기반 Imagen을 사용하면 제공된 텍스트 프롬프트를 기반으로 새 이미지를 생성하고 이미지를 수정할 수 있고 정의된 마스크 영역을 다른 기능의 호스트와 함께 사용하여 이미지의 일부만 수정할 수 있습니다.
모델 | 기능 | Description(설명) | 입력 | 출력 | 가격 |
---|---|---|---|---|---|
Imagen 3 | 이미지 생성 | 이미지 생성 이미지 수정 이미지 맞춤설정 |
텍스트 프롬프트 | 이미지 | 이미지당 $0.04 |
Imagen 3 빠름 | 이미지 생성 | 이미지 생성 | 텍스트 프롬프트 | 이미지 | 이미지당 $0.02 |
Imagen 2, Imagen | 이미지 생성 | 이미지 생성 | 텍스트 프롬프트 | 이미지 | 이미지당 $0.020 |
이미지 수정 | 마스크 없음 또는 마스크 방식을 사용하여 이미지 수정 | 이미지/텍스트 프롬프트 | 이미지 | 이미지당 $0.020 | |
업스케일링 | 생성된 이미지의 해상도를 2K 및 4K로 높입니다. | 이미지 | 이미지 | 이미지당 $0.003 | |
미세 조정 | 사용자가 제공한 '주제'를 Imagen 프롬프트(몇 장의 샷 학습)에서 사용하도록 사용 설정 | 텍스트 식별자와 주제당 4~8개의 이미지가 포함된 주제 | 미세 조정된 모델(사용자 제공 주제로 학습한 후) | 노드 시간당 $(Vertex AI 커스텀 학습 가격 책정) | |
시각적 캡셔닝 | 이미지에 대한 짧은 텍스트 설명 또는 긴 텍스트 설명 생성 | 이미지 | 텍스트 캡션 | $0.0015/이미지 | |
시각적 질의 응답 | 이미지를 참조하는 질문에 기반한 답변 제공 | 이미지/텍스트 프롬프트 | 텍스트 답변 | $0.0015/이미지 |
가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
Veo
Veo 2는 다양한 주제와 스타일로 놀라울 만큼 고품질의 동영상을 생성하며, 실제 물리 법칙과 인간의 움직임 및 표현의 미묘한 차이를 더 잘 이해할 수 있도록 도와줍니다.
모델 | 기능 | Description(설명) | 입력 | 출력 | 가격 |
---|---|---|---|---|---|
Veo 2 | 동영상 생성 | 텍스트 프롬프트 또는 참조 이미지로 동영상 생성 | 텍스트/이미지 프롬프트 | 동영상 | 초당 $0.50 |
AI 애플리케이션의 임베딩 비용 이해
모델 | 기능 | Description(설명) | 입력 | 출력 | 가격 |
---|---|---|---|---|---|
멀티모달 임베딩 | 멀티모달용 임베딩: 텍스트 | 텍스트를 입력으로 사용하여 임베딩 생성 | 텍스트 | 임베딩 | 1,000자 입력당 $0.0002 |
멀티모달용 임베딩: 이미지 | 이미지를 입력으로 사용하여 임베딩 생성 | 이미지 | 임베딩 | $0.0001 / 이미지 입력 | |
멀티모달용 임베딩: 동영상 플러스 | Video Plus | 동영상 | 임베딩(동영상 분당 최대 15개의 임베딩) | 동영상 초당 $0.0020 | |
멀티모달용 임베딩: 동영상 표준 | Video Standard | 동영상 | 임베딩(동영상 분당 최대 8개의 임베딩) | 동영상 1초당 $0.0010 | |
멀티모달용 임베딩: 동영상 에센셜 | Video Essential | 동영상 | 임베딩(동영상 분당 최대 4개의 임베딩) | 동영상 1초당 $0.0005 |
모델 | 유형 | 리전 | 1,000자당 가격 |
---|---|---|---|
텍스트용 임베딩 | 입력 | 전역 |
|
출력 | 글로벌 |
|
가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
Vertex AI의 코드 완성 가격 책정
Vertex AI의 생성형 AI는 입력(프롬프트) 1,000자마다, 출력(응답) 문자 1,000자마다 요금이 부과됩니다. 문자는 UTF-8 코드 포인트로 계산되며 화이트 스페이스는 개수에서 제외됩니다. 미리보기 단계에서는 요금이 100% 할인됩니다. 필터링된 응답으로 이어지는 예측 요청은 입력에 대한 요금만 청구됩니다. 결제 주기가 끝날 때마다 1센트 ($0.01)의 분수가 1센트로 반올림됩니다.
모델 | 유형 | 리전 | 1,000자당 가격 |
---|---|---|---|
코드 완성용 Codey | 입력 | 글로벌 |
|
출력 | 글로벌 |
|
가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
번역 (텍스트)
Vertex AI API 및 번역 LLM을 사용하여 텍스트를 번역합니다. LLM 번역은 기존 번역 모델보다 더 유창하고 자연스러운 경향이 있지만 지원 언어의 범위는 더 제한적입니다 (자세히 알아보기).
모델 | 메서드 | 사용 | 백만 자당 가격 |
---|---|---|---|
LLM | 텍스트 번역* | 월별 입력 문자 수 |
백만 자당 $10** |
출력 문자 월별 수 |
백만 자당 $10** |
가격은 미국 달러(USD)로 표기됩니다.
USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
*가격은 모델에서 처리한 문자 기준으로 책정됩니다. 문자 수에 관한 자세한 내용은 비용 청구 대상 문자를 참조하세요.
Vertex AI의 컨텍스트 캐싱으로 비용 최적화
컨텍스트 캐싱을 사용하면 입력 텍스트 또는 미디어의 컨텍스트 부분을 Gemini 모델에 캐싱하여 Gemini 입력 토큰 처리 비용을 75% 줄이고 콘텐츠 생성 지연 시간을 단축할 수 있습니다. 사용자가 제어할 수 있는 캐시에 데이터가 저장되는 시간에 따라 'Context Cache Storage' 요금이 결정됩니다. 캐시된 컨텍스트를 만들 때 사용자에게 표준 입력 토큰 비용이 청구됩니다. 입력 데이터의 캐시 적중은 일반 입력 비용 대신 '캐시된 입력'이라는 할인된 요금으로 청구됩니다. 스토리지와 입력 모두의 데이터 크기는 Gemini 입력 가격 책정과 동일한 방식으로 계산됩니다.
Gemini 2.5 모델
모델 | 기능 | 유형 | 가격 (/100만 토큰) <= 20만 입력 토큰 |
가격 (/100만 토큰) > 20만 입력 토큰 |
---|---|---|---|---|
Gemini 2.5 Pro | 캐시된 입력 | 입력 (텍스트, 이미지, 동영상, 오디오) | $0.31 (/100만 토큰) | $0.625 (/100만 토큰) |
출력 | 해당 사항 없음 | 해당 사항 없음 | ||
컨텍스트 캐시 스토리지 | 입력 (텍스트, 이미지, 동영상, 오디오) | $4.5 (/M Tok/시간) | $4.5 (/M Tok/시간) | |
Gemini 2.5 Flash | 캐시된 입력 | 입력 (텍스트, 이미지, 동영상, 오디오) | $0.0375 (/100만 토큰) | $0.0375 (/100만 토큰) |
출력 | 해당 사항 없음 | 해당 사항 없음 | ||
컨텍스트 캐시 스토리지 | 입력 (텍스트, 이미지, 동영상, 오디오) | $1 (/M 토크/시간) | $1 (/M 토크/시간) |
Gemini 2.0 모델
토큰 기반 가격 책정
모델 |
유형 |
스토리지 (백만 토큰 시간) |
가격 |
---|---|---|---|
Gemini 2.0 Flash |
|||
입력 토큰 100만 개 | $1.00 | $0.0375 | |
입력 오디오 토큰 100만 개 | $1.00 | $0.25 | |
출력 텍스트 토큰 100만 개 | 해당 사항 없음 | 해당 사항 없음 | |
Gemini 2.0 Flash Lite |
|||
입력 토큰 100만 개 | $1.00 | $0.01875 | |
입력 오디오 토큰 100만 개 | $1.00 | $0.01875 | |
출력 텍스트 토큰 100만 개 | 해당 사항 없음 | 해당 사항 없음 |
형식 기반 가격 책정
아래의 모드별 가격은 평균 사용 사례를 기준으로 하며 참고용입니다. 실제 청구는 토큰만 기준으로 이루어집니다.
- 4자(영문 기준)는 공백을 포함하여 약 1개의 텍스트 토큰이 됩니다.
- 1024x1024 이미지의 경우 1290개의 토큰을 사용합니다. 이미지당 토큰 수는 이미지 해상도에 따라 다릅니다. 토큰 계산 방법에 대한 자세한 내용은 문서를 참조하세요.
- 동영상 입력은 초당 프레임 1개의 샘플 속도에서 초당 258개의 토큰을 소비합니다. 동영상 토큰과 오디오 토큰 모두에 대한 오디오 청구가 포함된 동영상
- 오디오 입력은 타임스탬프 없이 초당 25개의 토큰을 소비합니다.
모델 |
유형 |
스토리지 (Modality-시간) |
가격 |
---|---|---|---|
Gemini 2.0 Flash |
|||
입력 텍스트 ($/M자) | $0.25 | $0.009375 | |
이미지 입력 ($/이미지) | $0.00129 | $0.000048375 | |
동영상 입력 ($/초) | $0.000258 | $0.000009675 | |
입력 오디오 ($/초) | $0.000025 | $0.00000625 | |
출력 텍스트 ($/M자) | 해당 사항 없음 | 해당 사항 없음 | |
Gemini 2.0 Flash Lite |
|||
입력 텍스트 ($/M자) | $0.25 | $0.0046875 | |
이미지 입력 ($/이미지) | $0.00129 | $0.0000241875 | |
동영상 입력 ($/초) | $0.000258 | $0.000009675 | |
입력 오디오 ($/초) | $0.000258 | $0.0000048375 | |
출력 텍스트 ($/M 문자) | 해당 사항 없음 | 해당 사항 없음 | |
Google 검색으로 그라운딩 |
Gemini 2.0 Flash에는 추가 요금 없이 하루 최대 1,500건의 지상 요청이 포함됩니다. Grounded 요청이 하루 1,500개를 초과하면 요청 1,000개당 35달러의 요금이 청구됩니다 (하루 최대 100만 개 요청). 하루에 100만 개 이상의 요청이 필요한 경우 계정팀에 문의하세요. |
||
엔터프라이즈를 위한 웹 그라운딩 |
2025년 5월 5일부터 요청 1,000개당 $45 (하루 최대 100만 개 요청). 하루에 100만 개 이상의 요청이 필요한 경우 계정팀에 문의하세요. |
* 가격은 미국 달러 (USD)로 표기됩니다.
USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
* PDF는 이미지 입력으로 청구되며, PDF 페이지 1개는 이미지 1개에 해당합니다.
* 조정된 모델 엔드포인트의 예측 가격은 기본 모델과 동일합니다.
* Google 검색을 통한 그라운딩은 웹에서 그라운딩 지원 URL이 하나 이상 포함된 결과를 반환하는 요청에 대해서만 청구됩니다. 표준 Gemini 모델 사용 요금도 적용됩니다.
프로비저닝된 처리량
프로비저닝된 처리량은 생성형 AI 요구사항에 맞는 처리량을 보장하며 생성형 AI 확장 단위(GSU)를 통해 거래됩니다. 각 GSU가 제공하는 처리량에 대해 자세히 알아보려면 여기를 참조하고 온라인 견적 도구를 사용하려면 여기를 참조하세요.
기간 | GSU당 가격 | 단위 |
---|---|---|
1주일 내 커밋* | $1,200 | 주 |
1개월 약정 | $2,700 | 월 |
3개월 약정 | $2,400 | 월 |
1년 약정 | $2,000 | 월 |
*1주일 약정은 유료 비공개 프리뷰 서비스입니다.
비용 계산 예시
사용자가 gemini-2.0-flash를 사용하여 텍스트 토큰 1,000개와 오디오 토큰 500개를 입력으로 하는 쿼리를 초당 10회 (QPS) 지원하고 텍스트 토큰 300개의 출력을 수신할 수 있어야 합니다.
gemini-2.0-flash의 처리량 및 소진율 표를 사용하면 입력 텍스트 토큰의 소진율은 1개 토큰, 입력 오디오 토큰의 소진율은 7개 토큰, 출력 텍스트 토큰의 소진율은 4개 토큰임을 알 수 있습니다.
사용자의 총 입력 토큰은 1,000* (입력 텍스트 토큰당 1개 토큰) + 500* (입력 오디오 토큰당 7개 토큰) = 4,500번의 소모 조정된 입력 토큰입니다. 사용자의 총 출력 토큰은 300* (출력 텍스트 토큰당 4개 토큰) = 1,200번의 연소 조정 출력 토큰입니다. 이를 모두 더하면 4,500개의 소진 조정 입력 토큰 + 1,200개의 소진 조정 출력 토큰 = 쿼리당 총 5,700개의 토큰이 됩니다.
쿼리당 총 토큰 수에 QPS를 곱하면 쿼리당 총 토큰 수 5,700개 * 10 QPS = 초당 총 토큰 수 57,000개가 됩니다.
이를 GSU당 초당 총 처리량으로 나누면 초당 총 토큰 57,000개 ÷ GSU당 초당 처리량 3,360개 = 16.96 GSU가 됩니다. 이 모델의 최소 GSU 구매 증분은 1이므로 사용자는 17개의 GSU가 필요합니다.
사용자가 이 처리량을 1주일 동안 유지하려면 $1,200 * 17 GSUs = 주당 $20,400의 비용이 듭니다. 이 처리량을 한 달 동안 유지하려면 $2,700 * 17 GSUs = 월 $45,900의 비용이 발생합니다. 이 처리량을 3개월 동안 유지하려면 월 $2,400 * 17 GSUs = $40,800의 비용이 듭니다. 마지막으로, 이 처리량을 1년 동안 유지하려면 월 $2,000 * 17 GSUs = $34,000의 비용이 듭니다.
Vertex AI의 파트너 모델 가격 비교
파트너 모델은 Google 파트너에서 개발한 선별된 생성형 AI 모델 목록입니다. 파트너 모델은 관리형 API로 제공됩니다. 자세한 내용은 파트너 모델 개요를 참조하세요. 다음 섹션에서는 Google 파트너 모델의 가격 책정 세부정보를 나열합니다.
AI21 Labs의 모델
모델 | 가격 책정 |
---|---|
Jamba 1.5 Large | 입력: 토큰 100만 개당 $2 출력: 토큰 100만 개당 $8 |
Jamba 1.5 Mini | 입력: 토큰 100만 개당 $0.20 출력: 토큰 100만 개당 $0.40 |
Anthropic의 Claude 모델
모델 | 가격 책정 |
---|---|
Claude 3.7 Sonnet | 입력: 토큰 100만 개당 $3 출력: 토큰 100만 개당 $15 일괄 입력: 토큰 100만 개당 $1.50 일괄 출력: 토큰 100만 개당 $7.50 캐시 쓰기: 토큰 100만 개당 $3.75 캐시 적중: 토큰 100만 개당 $0.30 일괄 캐시 쓰기: 토큰 100만 개당 $1.875 일괄 캐시 적중: 토큰 100만 개당 $0.15 |
Claude 3.5 Haiku | 입력: 토큰 100만 개당 $0.80 출력: 토큰 100만 개당 $4 일괄 입력: 토큰 100만 개당 $0.40 일괄 출력: 토큰 100만 개당 $2 캐시 쓰기: 토큰 100만 개당 $1 캐시 적중: 토큰 100만 개당 $0.08 일괄 캐시 쓰기: 토큰 100만 개당 $0.50 일괄 캐시 적중: 토큰 100만 개당 $0.04 |
Claude 3.5 Sonnet v2 | 입력: 토큰 100만 개당 $3 출력: 토큰 100만 개당 $15 일괄 입력: 토큰 100만 개당 $1.50 일괄 출력: 토큰 100만 개당 $7.50 캐시 쓰기: 토큰 100만 개당 $3.75 캐시 적중: 토큰 100만 개당 $0.30 일괄 캐시 쓰기: 토큰 100만 개당 $1.875 일괄 캐시 적중: 토큰 100만 개당 $0.15 |
Claude 3.5 Sonnet | 입력: 토큰 100만 개당 $3 출력: 토큰 100만 개당 $15 캐시 쓰기: 토큰 100만 개당 $3.75 캐시 적중: 토큰 100만 개당 $0.30 |
Claude 3 Haiku | 입력: 토큰 100만 개당 $0.25 출력: 토큰 100만 개당 $1.25 캐시 쓰기: 토큰 100만 개당 $0.30 캐시 적중: 토큰 100만 개당 $0.03 |
Claude 3 Sonnet (deprecated) | 입력: 토큰 100만 개당 $3 출력: 토큰 100만 개당 $15 |
Claude 3 Opus | 입력: 토큰 100만 개당 $15 출력: 토큰 100만 개당 $75 캐시 쓰기: 토큰 100만 개당 $18.75 캐시 적중: 토큰 100만 개당 $1.50 |
Meta의 Llama 모델
모델 | 가격 책정 |
---|---|
Llama 3.1 405B | 입력: 토큰 100만 개당 $5.00 출력: 토큰 100만 개당 $16.00 |
Llama 3.3 70B * | 입력: 토큰 100만 개당 $0.72 출력: 토큰 100만 개당 $0.72 |
Llama 4 Scout * | 입력: 토큰 100만 개당 $0.25 출력: 토큰 100만 개당 $0.70 |
Llama 4 Maverick * | 입력: 토큰 100만 개당 $0.35 출력: 토큰 100만 개당 $1.15 |
- 2025년 5월 1일까지 무료로 사용할 수 있습니다.
Mistral AI의 모델
모델 | 가격 책정 |
---|---|
Mistral Small 3.1 (25.03) | 입력: 토큰 100만 개당 $0.10 출력: 토큰 100만 개당 $0.30 |
Mistral Large (24.11) | 입력: 토큰 100만 개당 $2.00 출력: 토큰 100만 개당 $6.00 |
Mistral Nemo | 입력: 토큰 100만 개당 $0.15 출력: 토큰 100만 개당 $0.15 |
Codestral (25.01) | 입력: 토큰 100만 개당 $0.30 출력: 토큰 100만 개당 $0.90 |