이 페이지는 Cloud Translation API를 통해 번역되었습니다.

Vertex AI에서 AI 모델을 빌드하고 배포하는 비용

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

200 응답 코드를 반환하는 요청에 대해서만 요금이 청구됩니다. 4xx 및 5xx 코드와 같은 다른 응답 코드를 반환하는 요청에는 입력 또는 출력에 대한 요금이 청구되지 않습니다.

이 페이지에서는 Vertex AI의 생성형 AI 가격 책정을 설명합니다. ML Platform 및 MLOps 서비스 등 다른 모든 Vertex AI 가격 책정은 Vertex AI 가격 책정 페이지를 참조하세요.

Google 모델

Gemini 2.5

모델	유형	가격(백만 토큰당) <= 20만 입력 토큰	가격 (/100만 토큰) > 20만 입력 토큰	가격(백만 토큰당) < 20만 토큰 입력 토큰(일괄 API 사용)	가격 (/100만 토큰) > 일괄 API를 사용한 20만 개의 입력 토큰
Gemini 2.5 Pro
	입력 (텍스트, 이미지, 동영상, 오디오)	$1.25	$2.5	$0.625	$1.25
	텍스트 출력 (대답 및 추론)	$10	$15	$5	$7.5
Gemini 2.5 Flash 정식 버전
	입력(텍스트, 이미지, 동영상)	$0.30	$0.30	$0.15	$0.15
	오디오 입력	$1	$1	$0.5	$0.5
	텍스트 출력	$2.50	$2.50	$1.25	$1.25
	100만 개의 학습 토큰에 맞게 조정	$5.00	해당 사항 없음	해당 사항 없음	해당 사항 없음
Gemini 2.5 Flash 프리뷰 (2025년 7월 15일에 엔드포인트 중단)
	입력(텍스트, 이미지, 동영상)	$0.15	$0.15	$0.075	$0.075
	오디오 입력	$1	$1	$0.5	$0.5
	텍스트 출력(사고 없음)	$0.60	$0.60	$0.30	$0.30
	텍스트 출력(사고-대답 및 추론)	$3.50	$3.50	$1.75	$1.75
Gemini 2.5 Flash Live API
	입력 텍스트 토큰 100만 개	$0.5	$0.5	해당 사항 없음	해당 사항 없음
	입력 오디오 토큰 100만 개	$3	$3	해당 사항 없음	해당 사항 없음
	입력 동영상 토큰 100만 개	$3	$3	해당 사항 없음	해당 사항 없음
	출력 텍스트 토큰 100만 개	$2	$2	해당 사항 없음	해당 사항 없음
	출력 오디오 토큰 100만 개	$12	$12	해당 사항 없음	해당 사항 없음
Gemini 2.5 Flash Lite
	입력(텍스트, 이미지, 동영상)	$0.1	$0.1	해당 사항 없음	해당 사항 없음
	오디오 입력	$0.5	$0.5	해당 사항 없음	해당 사항 없음
	텍스트 출력 (대답 및 추론)	$0.4	$0.4	해당 사항 없음	해당 사항 없음
Google 검색으로 그라운딩	Gemini 2.0 Flash, 2.5 Flash, 2.5 Flash-Lite에는 하루에 1,500개의 그라운드된 프롬프트가 포함되며 추가 비용이 청구되지 않습니다. Gemini 2.5 Pro에는 추가 비용 없이 매일 10,000개의 그라운디드 프롬프트가 포함되어 있습니다. 그랜디드 프롬프트 한도를 초과하는 경우 그랜디드 프롬프트 1,000개당 35달러가 청구됩니다. 그라운디드 프롬프트는 Google 검색&ast;&ast;에 하나 이상의 검색어를 전달하는 Gemini에 제출된 요청입니다. 여러 검색어를 Google 검색에 전송하더라도 그라운딩 프롬프트는 한 번만 청구됩니다. 하루에 100만 개 이상의 그라운딩 프롬프트가 필요한 경우 계정팀에 문의하세요.
엔터프라이즈를 위한 웹 그라운딩	그라운딩된 프롬프트 1,000개당$45. 그라운디드 프롬프트는 엔터프라이즈**를 위한 웹 그라운딩에 하나 이상의 쿼리를 수행하는 Gemini에 제출된 요청입니다. 여러 검색어를 Google 검색에 전송하더라도 그라운딩 프롬프트는 한 번만 청구됩니다. 하루에 100만 개 이상의 그라운딩 프롬프트가 필요한 경우 계정팀에 문의하세요.
데이터로 그라운딩	2025년 6월 16일부터 요청 1,000개당 $2.5 청구

* 쿼리 입력 컨텍스트가 20만 토큰보다 긴 경우 모든 토큰 (입력 및 출력)에 긴 컨텍스트 요금이 청구됩니다.
** Google 검색을 통한 Grounding 및 엔터프라이즈용 웹 Grounding은 프롬프트가 웹 결과 (즉, 웹의 그라운딩 지원 URL이 하나 이상 포함된 결과)를 성공적으로 반환하는 경우에만 요금이 청구됩니다. Gemini 모델 사용 요금은 별도로 적용됩니다.

Gemini 2.0

Gemini 2.0은 토큰을 기준으로 청구됩니다. 요청을 전송하기 전에 요청의 입력 토큰 수를 계산하려면 SDK 토크나이저 또는 countTokens API를 사용할 수 있습니다. 요청이 400 또는 500 오류로 실패하면 사용한 토큰에 대한 요금이 청구되지 않습니다.

가격표의 전환 버튼을 사용해 토큰 기반 가격 책정과 모드 기반 가격 책정을 비교하세요.

토큰 기반 가격 책정

모델	유형	가격	Batch API를 사용한 가격 책정
Gemini 2.0 Flash
	입력 토큰 100만 개	$0.15	$0.075
	입력 오디오 토큰 100만 개	$1.00	$0.50
	출력 텍스트 토큰 100만 개	$0.60	$0.30
	학습 토큰 100만 개에 맞게 조정	$3.00
Gemini 2.0 Flash 이미지 생성
	입력 토큰 100만 개	$0.15
	입력 오디오 토큰 100만 개	$1.00
	입력 동영상 토큰 100만 개	$3
	출력 텍스트 토큰 100만 개	$0.60
	출력 이미지 토큰 100만 개	$30.00
Gemini 2.0 Flash Live API
	입력 텍스트 토큰 100만 개	$0.5
	입력 오디오 토큰 100만 개	$3
	입력 동영상 토큰 100만 개	$3
	출력 텍스트 토큰 100만 개	$2
	출력 오디오 토큰 100만 개	$12
Gemini 2.0 Flash Lite
	입력 토큰 100만 개	$0.075	$0.0375
	입력 오디오 토큰 100만 개	$0.075	$0.0375
	출력 텍스트 토큰 100만 개	$0.30	$0.15
	학습 토큰 100만 개에 맞게 조정	$1.00
Google 검색으로 그라운딩	Gemini 2.0 Flash와 2.5 Flash에는 하루에 1,500개의 그라운디드 프롬프트가 포함되며 추가 비용이 청구되지 않습니다. 그 한도를 초과하는 그라운디드 프롬프트는 1,000개당 $35의 요금이 청구됩니다. 그라운딩 프롬프트는 Google 검색*에 하나 이상의 검색어를 전송하는 Gemini에 제출된 요청입니다. 여러 검색어를 Google 검색에 전송하더라도 그라운딩 프롬프트는 한 번만 청구됩니다. 하루에 100만 개 이상의 그라운딩 프롬프트가 필요한 경우 계정팀에 문의하세요.
엔터프라이즈를 위한 웹 그라운딩	그라운딩된 프롬프트 1,000개당$45. 그라운디드 프롬프트는 엔터프라이즈용 웹 그라운딩*에 하나 이상의 쿼리를 수행하는 Gemini에 제출된 요청입니다. 여러 검색어를 Google 검색에 전송하더라도 그라운딩 프롬프트는 한 번만 청구됩니다. 하루에 100만 개 이상의 그라운딩 프롬프트가 필요한 경우 계정팀에 문의하세요.
데이터로 그라운딩	2025년 6월 16일부터 요청 1,000개당 $2.5 청구

형식 기반 가격 책정

아래의 모달리티 가격은 평균 사용 사례를 기준으로 하며 참고용입니다. 실제 청구는 토큰만 기준으로 이루어집니다.

4자(영문 기준)는 공백을 포함하여 약 1개의 텍스트 토큰이 됩니다.

1024x1024 이미지의 경우 1290개의 토큰을 사용합니다. 이미지당 토큰 수는 이미지 해상도에 따라 다릅니다. 토큰 계산 방법에 대한 자세한 내용은 문서를 참조하세요.

동영상 입력은 초당 프레임 1개의 샘플 속도에서 초당 258개의 토큰을 소비합니다. 동영상 토큰과 오디오 토큰 모두에 대한 오디오 청구가 포함된 동영상

오디오 입력은 타임스탬프 없이 초당 25개의 토큰을 소비합니다.

모델	유형	가격	Batch API를 사용한 가격 책정
Gemini 2.0 Flash
	텍스트 입력 ($/M자)	$0.0375	$0.01875
	이미지 입력 ($/이미지)	$0.0001935	$0.00009675
	동영상 입력 ($/초)	$0.0000387	$0.00001935
	입력 오디오 ($/초)	$0.000025	$0.0000125
	출력 텍스트 ($/M자)	$0.15	$0.075
Gemini 2.0 Flash 이미지 생성
	텍스트 입력 ($/M자)	$0.0375
	이미지 입력 ($/이미지)	$0.0001935
	동영상 입력 ($/초)	$0.0000387
	입력 오디오 ($/초)	$0.000025
	출력 텍스트 ($/M자)	$0.15
	출력 이미지 이미지 ($/이미지)	$0.04
Gemini 2.0 Flash Lite
	텍스트 입력 ($/M자)	$0.01875	$0.009375
	입력 이미지 ($/이미지)	$0.00009675	$0.000048375
	동영상 입력 ($/초)	$0.00001935	$0.000009675
	입력 오디오 ($/초)	$0.000001875	$0.000000938
	출력 텍스트 ($/M자)	$0.075	$0.0375
Google 검색으로 그라운딩	Gemini 2.0 Flash와 2.5 Flash에는 하루에 1,500개의 그라운디드 프롬프트가 포함되며 추가 비용이 청구되지 않습니다. 그 한도를 초과하는 그라운디드 프롬프트는 1,000개당 $35의 요금이 청구됩니다. 그라운딩 프롬프트는 Google 검색*에 하나 이상의 검색어를 전송하는 Gemini에 제출된 요청입니다. 여러 검색어를 Google 검색에 전송하더라도 그라운딩 프롬프트는 한 번만 청구됩니다. 하루에 100만 개 이상의 그라운딩 프롬프트가 필요한 경우 계정팀에 문의하세요.
엔터프라이즈를 위한 웹 그라운딩	그라운딩된 프롬프트 1,000개당$45. 그라운딩 프롬프트는 엔터프라이즈용 웹 그라운딩*에 하나 이상의 쿼리를 수행하는 Gemini에 제출된 요청입니다. 여러 검색어를 Google 검색에 전송하더라도 그라운딩 프롬프트는 한 번만 청구됩니다. 하루에 100만 개 이상의 그라운딩 프롬프트가 필요한 경우 계정팀에 문의하세요.

* 가격은 미국 달러 (USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
* 학습 토큰은 학습 데이터 세트의 토큰 총개수와 에포크 수를 곱하여 계산됩니다.
* PDF는 이미지 입력으로 청구되며, PDF 페이지 1개는 이미지 1개에 해당합니다.
* 조정된 모델 엔드포인트의 예측 가격은 기본 모델과 동일합니다.
* Google 검색 및 엔터프라이즈용 웹 그라운딩을 사용한 그라운딩은 프롬프트가 웹 결과 (즉, 웹의 그라운딩 지원 URL이 하나 이상 포함된 결과)를 성공적으로 반환하는 경우에만 청구됩니다. Gemini 모델 사용 요금은 별도로 적용됩니다.
* Gemini 2.0 Flash Live API: 오디오 (입력/출력) 1초당 25개 토큰, 동영상 (입력) 1초당 258개 토큰 Gemini 2.0 Flash Live API가 프리뷰 버전인 동안에는 Google 검색을 사용한 그라운딩이 계속 무료로 제공됩니다.

Vertex AI 모델 최적화 도구 가격 책정 (실험적 기능)*

Vertex AI Model Optimizer는 Gemini 모델 요청을 위한 단일 메타 엔드포인트를 제공하여 엔터프라이즈 고객의 Gemini 사용을 간소화합니다. 이 서비스를 사용하는 고객은 Flash, Pro 또는 특정 버전을 사용할지 여부를 지정할 필요가 없습니다. 대신 개발자는 선호도를 나타내는 구성 가능한 설정 (비용, 품질 또는 균형)을 제공하기만 하면 됩니다. 그러면 Model Optimizer가 각 쿼리를 가장 적합한 모델로 전송하여 작업에 적합한 수준의 인텔리전스를 적용합니다.

Vertex AI 모델 옵티마이저가 동적 가격 책정을 적용합니다. 즉, 토큰당 평균 가격은 태스크를 완료하기 위해 적용된 모델 인텔리전스 수준에 따라 달라집니다. 이러한 이유로 아래에는 구성 설정에 따라 발생할 수 있는 시나리오를 보여주는 가격 책정 예시가 제공됩니다 (아래 표 참고). 모델 최적화 SKU는 $1 SKU로 결제에 적용되는 구매 단위로 사용되며, 모델을 사용한 후에도 계속 사용량 기준으로 청구됩니다.

5:1 I/O 비율	예시 1 채팅 봇	참고: 이 범위는 보장된 것이 아니며 고객별 결과는 다를 수 있습니다.
고객 선호도	고객 입력 토큰이 MO로 전송됨	고객 출력 토큰이 MO로 전송됨	토큰 100만 개당 평균 입력 가격 (상한)	토큰 100만 개당 평균 출력 가격 (상한)	토큰 100만 개당 평균 입력 가격 (하한가)	토큰 100만 개당 평균 출력 가격 (하한가)
비용	10,000,000	2,000,000	$0.63	$2.50	$0.16	$0.63
균형	10,000,000	2,000,000	$1.26	$5.00	$0.63	$2.50
품질	10,000,000	2,000,000	$1.89(약)	$7.50	$1.26	$5.00

1:20 I/O 비율	예시 2 콘텐츠 생성
고객 선호도	고객 입력 토큰이 MO로 전송됨	고객 출력 토큰이 MO로 전송됨	토큰 100만 개당 평균 입력 가격 (상한)	토큰 100만 개당 평균 출력 가격 (상한)	토큰 100만 개당 평균 입력 가격 (하한가)	토큰 100만 개당 평균 출력 가격 (하한가)
비용	1,000,000	20,000,000	$0.63	$2.50	$0.16	$0.63
균형	1,000,000	20,000,000	$1.26	$5.00	$0.63	$2.50
품질	1,000,000	20,000,000	$1.89(약)	$7.50	$1.26	$5.00

* 모델 옵티마이저는 유료 실험용 서비스이며 Vertex의 Gemini 실험 버전으로 요청을 라우팅할 수 있습니다.

기타 Gemini 모델

Gemini 2.0을 제외한 모든 Gemini 모델은 문자, 이미지, 동영상/오디오 초와 같은 모드에 따라 요금이 청구됩니다. 텍스트 입력은 입력 (프롬프트) 1,000자 및 출력 (응답) 1,000자마다 요금이 청구됩니다. 문자는 UTF-8 코드 포인트로 계산되며 공백은 개수에서 제외되므로 토큰당 약 4개의 문자가 됩니다. 필터링된 응답으로 이어지는 예측 요청은 입력에 대한 요금만 청구됩니다. 결제 주기가 끝날 때마다 1센트 ($0.01)의 분수가 1센트로 반올림됩니다. 미디어 입력은 이미지 또는 초당 (동영상) 요금이 청구됩니다. 요청이 실패하여 400 또는 500 오류가 발생하는 경우 사용된 토큰에 대한 요금이 청구되지 않습니다.

모델	기능	유형	가격 ( =< 128K 입력 토큰)	가격 (128,000개 이상의 입력 토큰)
Gemini 1.5 Flash	멀티모달	이미지 입력 동영상 입력 텍스트 입력 오디오 입력	$0.00002 / 이미지 $0.00002 / 초 $0.00001875 / 1,000자 $0.000002 / 초	$0.00004 / 이미지 $0.00004 / 초 $0.0000375 / 1,000자 $0.000004 / 초
		텍스트 출력	$0.000075 / 1,000자	1,000자당 $0.00015
	조정*	학습 토큰	토큰 100만 개당 $8
Gemini 1.5 Pro	멀티모달	이미지 입력 동영상 입력 텍스트 입력 오디오 입력	$0.00032875 / 이미지 $0.00032875 / 초 $0.0003125 / 1,000자 $0.00003125 / 초	$0.0006575 / 이미지 $0.0006575 / 초 $0.000625 / 1,000자 $0.0000625 / 초
		텍스트 출력	$0.00125 / 1,000자	1,000자당 $0.0025
	조정*	학습 토큰	토큰 100만 개당 $80
Gemini 1.0 Pro	멀티모달	이미지 입력 동영상 입력 텍스트 입력	$0.0025/이미지 $0.002/초 $0.000125/1,000자
Gemini 1.0 Pro		텍스트 출력	$0.000375/1000자
Google 검색을 사용하는 그라운딩	텍스트	그라운딩 프롬프트 1,000개당$35. 그라운딩된 프롬프트는 Google 검색*에 하나 이상의 검색어를 전달하는 Gemini에 제출된 요청입니다. 여러 검색어를 Google 검색에 전송하더라도 그라운딩 프롬프트는 한 번만 청구됩니다. 하루에 100만 개 이상의 그라운딩 프롬프트가 필요한 경우 계정팀에 문의하세요.
엔터프라이즈용 웹 그라운딩	텍스트	그라운딩된 프롬프트 1,000개당$45. 그라운딩 프롬프트는 엔터프라이즈용 웹 그라운딩*에 하나 이상의 쿼리를 수행하는 Gemini에 제출된 요청입니다. 여러 검색어를 Google 검색에 전송하더라도 그라운딩 프롬프트는 한 번만 청구됩니다. 하루에 100만 개 이상의 그라운딩 프롬프트가 필요한 경우 계정팀에 문의하세요.
데이터로 그라운딩	텍스트	2025년 6월 16일부터 요청 1,000개당 $2.5 청구됩니다.

* 가격은 미국 달러 (USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
* 쿼리 컨텍스트가 128, 000개를 초과하는 경우 모든 토큰에 긴 컨텍스트 요금이 적용됩니다.
* Gemini 모델은 일괄 모드에서 50% 할인된 가격으로 사용할 수 있습니다.
* Gemini 1.0 Pro는 최대 32K 컨텍스트 창만 지원합니다.
* PDF는 이미지 입력으로 청구되며, PDF 페이지 1개는 이미지 1개에 해당합니다.
* 조정된 모델 엔드포인트의 예측 가격은 기본 모델과 동일합니다.
* Google 검색 및 엔터프라이즈용 웹 그라운딩을 사용한 그라운딩은 프롬프트가 웹 결과 (즉, 웹의 그라운딩 지원 URL이 하나 이상 포함된 결과)를 성공적으로 반환하는 경우에만 청구됩니다. Gemini 모델 사용료는 별도로 적용됩니다.

Imagen

Vertex AI 기반 Imagen을 사용하면 제공된 텍스트 프롬프트를 기반으로 새 이미지를 생성하고 이미지를 수정할 수 있고 정의된 마스크 영역을 다른 기능의 호스트와 함께 사용하여 이미지의 일부만 수정할 수 있습니다.

모델	기능	Description(설명)	입력	출력	가격
Imagen 4 Ultra	이미지 생성	이미지 생성	텍스트 프롬프트	이미지	이미지당 $0.06
이미지 4	이미지 생성	이미지 생성	텍스트 프롬프트	이미지	이미지당 $0.04
Imagen 4 빠름	이미지 생성	이미지 생성	텍스트 프롬프트	이미지	이미지당 $0.02
Imagen 3	이미지 생성	이미지 생성 이미지 수정 이미지 맞춤설정	텍스트 프롬프트	이미지	이미지당 $0.04
Imagen 3 빠름	이미지 생성	이미지 생성	텍스트 프롬프트	이미지	이미지당 $0.02
Imagen 2, Imagen	이미지 생성	이미지 생성	텍스트 프롬프트	이미지	이미지당 $0.020
	이미지 수정	마스크 없음 또는 마스크 방식을 사용하여 이미지 수정	이미지/텍스트 프롬프트	이미지	이미지당 $0.020
	업스케일링	생성된 이미지의 해상도를 2K 및 4K로 높입니다.	이미지	이미지	이미지당 $0.003
	미세 조정	사용자가 제공한 '주제'를 Imagen 프롬프트(몇 장의 샷 학습)에서 사용하도록 사용 설정	텍스트 식별자와 주제당 4~8개의 이미지가 포함된 주제	미세 조정된 모델(사용자 제공 주제로 학습한 후)	노드 시간당 $(Vertex AI 커스텀 학습 가격 책정)
	시각적 캡셔닝	이미지에 대한 짧은 텍스트 설명 또는 긴 텍스트 설명 생성	이미지	텍스트 캡션	$0.0015/이미지
	시각적 질의 응답	이미지를 참조하는 질문에 기반하여 답변 제공	이미지/텍스트 프롬프트	텍스트 답변	$0.0015/이미지

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

Veo

Veo 2는 다양한 주제와 스타일로 놀라울 만큼 고품질의 동영상을 생성하며, 실제 물리 법칙과 인간의 움직임 및 표현의 미묘한 차이를 더 잘 이해할 수 있도록 도와줍니다.

모델	기능	설명	입력	출력	가격
Veo 3 - 빠른	동영상 생성	텍스트 프롬프트 또는 참조 이미지로 동영상 생성	텍스트/이미지 프롬프트	동영상	0.50달러/초
Veo 3 - 빠른	동영상 + 오디오 생성	텍스트 프롬프트 또는 참조 이미지에서 음성/사운드 효과와 동기화된 동영상 생성	텍스트/이미지 프롬프트	동영상 + 오디오	$0.75/초
Veo 2	동영상 생성	텍스트 프롬프트 또는 참조 이미지로 동영상 생성	텍스트/이미지 프롬프트	동영상	0.50달러/초
Veo 2	고급 제어	시작 및 종료 프레임 보간을 통해 동영상을 생성하고, 생성된 동영상을 확장하고, 카메라 컨트롤을 적용하세요	텍스트/이미지/동영상 프롬프트	동영상	0.50달러/초

Lyria

Lyria 2는 미묘한 뉘앙스가 중요한 정교한 작곡과 세부적인 창작 탐색에 적합한 고품질 악기 연주 음악을 생성합니다.

모델	기능	설명	입력	출력	가격
Lyria 2	음악 생성	텍스트 프롬프트로 음악 생성	텍스트 프롬프트	음악	30초당 $0.06

AI 애플리케이션의 임베딩 비용 이해

모델	유형	리전	입력 토큰 1,000개당 가격
Gemini 임베딩	입력	전역	온라인 요청: $0.00015 일괄 요청: $0.00012
Gemini 임베딩	출력	글로벌	온라인 요청: 무료 일괄 요청: 무료

모델	유형	리전	1,000자당 가격
텍스트용 임베딩 (Gemini 임베딩 제외)	입력	전역	온라인 요청: $0.000025 일괄 요청: $0.00002
텍스트용 임베딩 (Gemini 임베딩 제외)	출력	글로벌	온라인 요청: 무료 일괄 요청: 무료

모델	기능	Description(설명)	입력	출력	가격
멀티모달 임베딩	멀티모달용 임베딩: 텍스트	텍스트를 입력으로 사용하여 임베딩 생성	텍스트	임베딩	1,000자 입력당 $0.0002
	멀티모달용 임베딩: 이미지	이미지를 입력으로 사용하여 임베딩 생성	이미지	임베딩	$0.0001 / 이미지 입력
	멀티모달용 임베딩: 동영상 플러스	Video Plus	동영상	임베딩(동영상 분당 최대 15개의 임베딩)	동영상 초당 $0.0020
	멀티모달용 임베딩: 동영상 표준	Video Standard	동영상	임베딩(동영상 분당 최대 8개의 임베딩)	동영상 1초당 $0.0010
	멀티모달용 임베딩: 동영상 에센셜	Video Essential	동영상	임베딩(동영상 분당 최대 4개의 임베딩)	동영상 1초당 $0.0005

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

Vertex AI의 코드 완성 가격 책정

Vertex AI의 생성형 AI는 입력(프롬프트) 1,000자마다, 출력(응답) 문자 1,000자마다 요금이 부과됩니다. 문자는 UTF-8 코드 포인트로 계산되며 화이트 스페이스는 개수에서 제외됩니다. 미리보기 단계에서는 요금이 100% 할인됩니다. 필터링된 응답으로 이어지는 예측 요청은 입력에 대한 요금만 청구됩니다. 결제 주기가 끝날 때마다 1센트 ($0.01)의 분수가 1센트로 반올림됩니다.

모델	유형	리전	1,000자당 가격
코드 완성용 Codey	입력	글로벌	온라인 요청: $0.00025
코드 완성용 Codey	출력	글로벌	온라인 요청: $0.0005

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

번역 (텍스트)

Vertex AI API 및 번역 LLM을 사용하여 텍스트를 번역합니다. LLM 번역은 기존 번역 모델보다 더 유창하고 자연스러운 경향이 있지만 지원 언어의 범위는 더 제한적입니다 (자세히 알아보기).

모델	메서드	사용	백만 자당 가격
LLM	텍스트 번역^*	월별 입력 문자 수	백만 자당 $10^
	텍스트 번역^*	출력 문자 수(월 단위)	백만 자당 $10^

가격은 미국 달러(USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
^*가격은 모델에서 처리한 문자 기준으로 책정됩니다. 문자 수에 관한 자세한 내용은 비용 청구 대상 문자를 참조하세요.

Vertex AI의 컨텍스트 캐싱으로 비용 최적화

컨텍스트 캐싱을 사용하면 입력 텍스트 또는 미디어의 컨텍스트 부분을 Gemini 모델에 캐싱하여 Gemini 입력 토큰 처리 비용을 75% 줄이고 콘텐츠 생성 지연 시간을 단축할 수 있습니다. 사용자가 제어할 수 있는 캐시에 데이터가 저장되는 시간에 따라 'Context Cache Storage' 요금이 결정됩니다. 캐시된 컨텍스트를 만들 때 사용자에게 표준 입력 토큰 비용이 청구됩니다. 입력 데이터의 캐시 적중은 일반 입력 비용 대신 '캐시된 입력'이라는 할인된 요금으로 청구됩니다. 스토리지와 입력 모두의 데이터 크기는 Gemini 입력 가격 책정과 동일한 방식으로 계산됩니다.

Gemini 2.5 모델

모델	기능	유형	가격(백만 토큰당) <= 20만 입력 토큰	가격 (/100만 토큰) > 입력 토큰 20만 개
Gemini 2.5 Pro	캐시된 입력	입력 (텍스트, 이미지, 동영상, 오디오)	$0.31 (/1백만 토큰)	$0.625 (/100만 토큰)
		출력	해당 사항 없음	해당 사항 없음
	컨텍스트 캐시 스토리지	입력 (텍스트, 이미지, 동영상, 오디오)	$4.5 (/M Tok/시간)	$4.5 (/M Tok/시간)
Gemini 2.5 Flash	캐시된 입력	입력 (텍스트, 이미지, 동영상, 오디오)	$0.0375 (/100만 토큰)	$0.0375 (/100만 토큰)
		출력	해당 사항 없음	해당 사항 없음
	컨텍스트 캐시 스토리지	입력 (텍스트, 이미지, 동영상, 오디오)	$1 (/M Tok/시간)	$1 (/M Tok/시간)

Gemini 2.0 모델

토큰 기반 가격 책정

모델	유형	스토리지 (백만 토큰-시간)	가격
Gemini 2.0 Flash
	입력 토큰 100만 개	$1.00	$0.0375
	입력 오디오 토큰 100만 개	$1.00	$0.25
	출력 텍스트 토큰 100만 개	해당 사항 없음	해당 사항 없음
Gemini 2.0 Flash Lite
	입력 토큰 100만 개	$1.00	$0.01875
	입력 오디오 토큰 100만 개	$1.00	$0.01875
	출력 텍스트 토큰 100만 개	해당 사항 없음	해당 사항 없음

형식 기반 가격 책정

아래의 모달리티 가격은 평균 사용 사례를 기준으로 하며 참고용입니다. 실제 청구는 토큰만 기준으로 이루어집니다.

4자(영문 기준)는 공백을 포함하여 약 1개의 텍스트 토큰이 됩니다.

동영상 입력은 초당 프레임 수 1의 샘플 속도에서 초당 258개의 토큰을 소비합니다. 동영상 토큰과 오디오 토큰 모두에 대한 오디오 청구가 포함된 동영상

오디오 입력은 타임스탬프 없이 초당 25개의 토큰을 소비합니다.

모델	유형	스토리지 (Modality-시간)	가격
Gemini 2.0 Flash
	텍스트 입력 ($/M자)	$0.25	$0.009375
	이미지 입력 ($/이미지)	$0.00129	$0.000048375
	동영상 입력 ($/초)	$0.000258	$0.000009675
	입력 오디오 ($/초)	$0.000025	$0.00000625
	출력 텍스트 ($/M 문자)	해당 사항 없음	해당 사항 없음
Gemini 2.0 Flash Lite
	텍스트 입력 ($/M자)	$0.25	$0.0046875
	이미지 입력 ($/이미지)	$0.00129	$0.0000241875
	동영상 입력 ($/초)	$0.000258	$0.000009675
	입력 오디오 ($/초)	$0.000258	$0.0000048375
	출력 텍스트 ($/M 문자)	해당 사항 없음	해당 사항 없음
Google 검색으로 그라운딩	Gemini 2.0 Flash에는 추가 요금 없이 하루 최대 1,500건의 지상 요청이 포함됩니다. Grounded 요청이 하루 1,500개를 초과하는 경우 요청 1,000개당 35달러의 요금이 청구됩니다 (하루 최대 100만 개의 요청). 하루에 100만 개 이상의 요청이 필요한 경우 계정팀에 문의하세요.
엔터프라이즈를 위한 웹 그라운딩	2025년 5월 5일부터 요청 1,000개당 $45 (하루 최대 100만 개 요청). 하루에 100만 개 이상의 요청이 필요한 경우 계정팀에 문의하세요.

* 가격은 미국 달러 (USD)로 표기됩니다. USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.
* PDF는 이미지 입력으로 청구되며, PDF 페이지 1개는 이미지 1개에 해당합니다.
* 조정된 모델 엔드포인트의 예측 가격은 기본 모델과 동일합니다.
* Google 검색을 통한 그라운딩은 웹에서 그라운딩 지원 URL이 하나 이상 포함된 결과를 반환하는 요청에 대해서만 청구됩니다. 표준 Gemini 모델 사용 요금도 적용됩니다.

프로비저닝된 처리량

프로비저닝된 처리량은 생성형 AI 요구사항에 맞는 처리량을 보장하며 생성형 AI 확장 단위(GSU)를 통해 거래됩니다. 각 GSU가 제공하는 처리량에 대해 자세히 알아보려면 여기를 참조하고 온라인 견적 도구를 사용하려면 여기를 참조하세요.

기간	GSU당 가격	단위
1주 커밋	$1,200	주
1개월 약정	$2,700	월
3개월 약정	$2,400	월
1년 약정	$2,000	월

비용 계산 예시

사용자가 gemini-2.0-flash를 사용하여 텍스트 토큰 1,000개와 오디오 토큰 500개를 입력으로 하는 쿼리를 초당 10회 (QPS) 지원하고 텍스트 토큰 300개의 출력을 수신할 수 있어야 합니다.

gemini-2.0-flash의 처리량 및 소진율 표를 사용하면 입력 텍스트 토큰의 소진율은 1개 토큰, 입력 오디오 토큰의 소진율은 7개 토큰, 출력 텍스트 토큰의 소진율은 4개 토큰임을 알 수 있습니다.

사용자의 총 입력 토큰은 1,000* (입력 텍스트 토큰당 1개 토큰) + 500* (입력 오디오 토큰당 7개 토큰) = 4,500번의 소모 조정된 입력 토큰입니다. 사용자의 총 출력 토큰은 300* (출력 텍스트 토큰당 4개 토큰) = 1,200번의 연소 조정 출력 토큰입니다. 이를 모두 더하면 4,500개의 소진 조정 입력 토큰 + 1,200개의 소진 조정 출력 토큰 = 쿼리당 총 5,700개의 토큰이 됩니다.

쿼리당 총 토큰 수에 QPS를 곱하면 쿼리당 총 토큰 수 5,700개 * 10 QPS = 초당 총 토큰 수 57,000개가 됩니다.

이를 GSU당 초당 총 처리량으로 나누면 초당 총 토큰 57,000개 ÷ GSU당 초당 처리량 3,360개 = 16.96 GSU가 됩니다. 이 모델의 최소 GSU 구매 증분은 1이므로 사용자는 17개의 GSU가 필요합니다.

사용자가 1주일 동안 이 처리량을 유지하려면 $1,200 * 17 GSUs = 주당 $20,400의 비용이 듭니다. 이 처리량을 한 달 동안 유지하려면 $2,700 * 17 GSUs = 월 $45,900의 비용이 발생합니다. 이 처리량을 3개월 동안 유지하려면 월 $2,400 * 17 GSUs = $40,800의 비용이 발생합니다. 마지막으로, 이 처리량을 1년 동안 유지하려면 월 $2,000 * 17 GSUs = $34,000의 비용이 듭니다.

Vertex AI의 파트너 모델 가격 비교

파트너 모델은 Google 파트너에서 개발한 선별된 생성형 AI 모델 목록입니다. 파트너 모델은 관리형 API로 제공됩니다. 자세한 내용은 파트너 모델 개요를 참조하세요. 다음 섹션에서는 Google 파트너 모델의 가격 책정 세부정보를 나열합니다.

AI21 Lab의 모델

모델	가격 책정
Jamba 1.5 Large	입력: 토큰 100만 개당 $2 출력: 토큰 100만 개당 $8
Jamba 1.5 Mini	입력: 토큰 100만 개당 $0.20 출력: 토큰 100만 개당 $0.40

Anthropic의 Claude 모델

모델	가격 책정
Claude Opus 4	입력: 토큰 100만 개당 $15 출력: 토큰 100만 개당 $75 일괄 입력: 토큰 100만 개당 $7.50 일괄 출력: 토큰 100만 개당 $37.50 캐시 쓰기: 토큰 100만 개당 $18.75 캐시 적중: 토큰 100만 개당 $1.50 일괄 캐시 쓰기: 토큰 100만 개당 $9.375 일괄 캐시 적중: 토큰 100만 개당 $0.75
Claude Sonnet 4	입력: 토큰 100만 개당 $3 출력: 토큰 100만 개당 $15 일괄 입력: 토큰 100만 개당 $1.50 일괄 출력: 토큰 100만 개당 $7.50 캐시 쓰기: 토큰 100만 개당 $3.75 캐시 적중: 토큰 100만 개당 $0.30 일괄 캐시 쓰기: 토큰 100만 개당 $1.875 일괄 캐시 적중: 토큰 100만 개당 $0.15
Claude 3.7 Sonnet	입력: 토큰 100만 개당 $3 출력: 토큰 100만 개당 $15 일괄 입력: 토큰 100만 개당 $1.50 일괄 출력: 토큰 100만 개당 $7.50 캐시 쓰기: 토큰 100만 개당 $3.75 캐시 적중: 토큰 100만 개당 $0.30 일괄 캐시 쓰기: 토큰 100만 개당 $1.875 일괄 캐시 적중: 토큰 100만 개당 $0.15
Claude 3.5 Haiku	입력: 토큰 100만 개당 $0.80 출력: 토큰 100만 개당 $4 일괄 입력: 토큰 100만 개당 $0.40 일괄 출력: 토큰 100만 개당 $2 캐시 쓰기: 토큰 100만 개당 $1 캐시 적중: 토큰 100만 개당 $0.08 일괄 캐시 쓰기: 토큰 100만 개당 $0.50 일괄 캐시 적중: 토큰 100만 개당 $0.04
Claude 3.5 Sonnet v2	입력: 토큰 100만 개당 $3 출력: 토큰 100만 개당 $15 일괄 입력: 토큰 100만 개당 $1.50 일괄 출력: 토큰 100만 개당 $7.50 캐시 쓰기: 토큰 100만 개당 $3.75 캐시 적중: 토큰 100만 개당 $0.30 일괄 캐시 쓰기: 토큰 100만 개당 $1.875 일괄 캐시 적중: 토큰 100만 개당 $0.15
Claude 3.5 Sonnet	입력: 토큰 100만 개당 $3 출력: 토큰 100만 개당 $15 캐시 쓰기: 토큰 100만 개당 $3.75 캐시 적중: 토큰 100만 개당 $0.30
Claude 3 Haiku	입력: 토큰 100만 개당 $0.25 출력: 토큰 100만 개당 $1.25 캐시 쓰기: 토큰 100만 개당 $0.30 캐시 적중: 토큰 100만 개당 $0.03
Claude 3 Sonnet (deprecated)	입력: 토큰 100만 개당 $3 출력: 토큰 100만 개당 $15
Claude 3 Opus	입력: 토큰 100만 개당 $15 출력: 토큰 100만 개당 $75 캐시 쓰기: 토큰 100만 개당 $18.75 캐시 적중: 토큰 100만 개당 $1.50

Meta의 Llama 모델

모델	가격 책정
Llama 3.1 405B	입력: 토큰 100만 개당 $5.00 출력: 토큰 100만 개당 $16.00
Llama 3.3 70B *	입력: 토큰 100만 개당 $0.72 출력: 토큰 100만 개당 $0.72
Llama 4 Scout *	입력: 토큰 100만 개당 $0.25 출력: 토큰 100만 개당 $0.70
Llama 4 매버릭 *	입력: 토큰 100만 개당 $0.35 출력: 토큰 100만 개당 $1.15

2025년 5월 1일까지 무료로 사용할 수 있습니다.

Mistral AI의 모델

모델	가격 책정
Mistral OCR (25.05)	입력: 토큰 100만 개당 $0.0005 (또는 페이지당 $0.0005) 출력: 토큰 100만 개당 $0.0005 (또는 페이지당 $0.0005)
Mistral Small 3.1 (25.03)	입력: 토큰 100만 개당 $0.10 출력: 토큰 100만 개당 $0.30
Mistral Large (24.11)	입력: 토큰 100만 개당 $2.00 출력: 토큰 100만 개당 $6.00
Mistral Nemo	입력: 토큰 100만 개당 $0.15 출력: 토큰 100만 개당 $0.15
Codestral (25.01)	입력: 토큰 100만 개당 $0.30 출력: 토큰 100만 개당 $0.90

커스텀 견적 요청

Google Cloud의 사용한 만큼만 지불하는 가격 책정 방식을 사용하면 사용한 서비스에 대한 요금만 지불하면 됩니다. 영업팀에 문의하여 조직에 대한 커스텀 견적을 받아 보세요.

영업팀에 문의