Biaya membangun dan men-deploy model AI di Vertex AI

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.

Anda hanya dikenai biaya untuk permintaan yang menampilkan kode respons 200. Permintaan yang menampilkan kode respons lainnya, seperti kode 4xx dan 5xx, tidak dikenai biaya untuk input atau output.

Halaman ini membahas harga untuk AI Generatif di Vertex AI. Untuk semua harga Vertex AI lainnya, termasuk layanan Platform ML dan MLOps, lihat halaman harga Vertex AI.

Model Google

Gemini 3

Model	Jenis	Harga (/1 juta token) <= 200 ribu token input	Harga (/1 juta token) > 200 ribu token input	Harga (/1 juta token) <= 200 ribu token input yang di-cache	Harga (/1 juta token) > 200 ribu token input yang di-cache	Harga (/1 juta token) <= 200 ribu token input dengan API batch	Harga (/1 juta token) > 200 ribu token input dengan API batch
Pratinjau Gemini 3 Pro
	Input (teks, gambar, video, audio)	$2	$4	$0,2	$0,4	$1	$2
	Output teks (respons dan penalaran)	$12	$18	T/A	T/A	$6	$9
	Output Gambar**	$120	T/A	T/A	T/A	$60	T/A
Pratinjau Gemini 3 Flash
	Input (teks, gambar, video)	$0,5	$0,5	$0,05	$0,05	$0,25	$0,25
	Input (audio)	$1	$1	$0,1	$0,1	$0,5	$0,5
	Output teks (respons dan penalaran)	$3	$3	T/A	T/A	$1,5	$1,5
Grounding dengan Google Penelusuran & Grounding Web untuk Perusahaan	Mencakup 5.000 kueri penelusuran per bulan tanpa biaya, yang diagregatkan di semua model Gemini 3. Kueri penelusuran yang melebihi batas tersebut akan ditagih dengan harga $14 per 1.000 kueri penelusuran. Permintaan yang dikirimkan pelanggan ke Gemini dapat menghasilkan satu atau beberapa kueri ke Google Penelusuran (atau Perujukan Web untuk Enterprise). Anda akan dikenai biaya untuk setiap kueri penelusuran yang dilakukan. Penagihan akan dimulai pada 5 Januari 2026. Token input yang disediakan oleh Perujukan dengan Google Penelusuran atau Perujukan Web untuk Enterprise tidak dikenai biaya. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.
Grounding dengan Google Maps	Mencakup 5.000 kueri penelusuran per bulan tanpa biaya, yang diagregatkan di semua model Gemini 3. Kueri Maps yang melebihi batas tersebut akan ditagih dengan harga $14 per 1.000 kueri. Permintaan yang dikirimkan pelanggan ke Gemini dapat menghasilkan satu atau beberapa kueri ke Google Maps. Anda akan dikenai biaya untuk setiap kueri individual yang dijalankan. Penagihan akan dimulai pada 5 Januari 2026 Token input yang disediakan oleh Google Maps tidak dikenai biaya.
Grounding dengan data Anda	$2,50 per 1.000 perintah.

* Jika konteks input kueri lebih panjang dari 200 ribu token, semua token (input dan output) akan dikenai biaya dengan tarif konteks panjang.
** Gambar output 1K (1024x1024) dan 2K (2048x2048) menggunakan 1.120 token output gambar, yang setara dengan $0,134/gambar yang dihasilkan. Gambar 4K (4096x4096) menggunakan 2.000 token output gambar, yang setara dengan $0,24/gambar yang dihasilkan.

Gemini 2.5

Model	Jenis	Harga (/1 juta token) <= 200 ribu token input	Harga (/1 juta token) > 200 ribu token input	Harga (/1 juta token) <= 200 ribu token input yang di-cache	Harga (/1 juta token) > 200 ribu token input yang di-cache	Harga (/1 juta token) <= 200 ribu token input dengan API batch	Harga (/1 juta token) > 200 ribu token input dengan API batch
Gemini 2.5 Pro
	Input (teks, gambar, video, audio)	$1.25	$2,5	$0,125	$0,250	$0,625	$1.25
	Output teks (respons dan penalaran)	$10	$15	T/A	T/A	$5	$7,5
Gemini 2.5 Pro Penggunaan Komputer-Pratinjau
	Input (teks, gambar, video, audio)	$1.25	$2,5	T/A	T/A	T/A	T/A
	Output teks (respons dan penalaran)	$10,00	$15,00	T/A	T/A	T/A	T/A
Gemini 2.5 Flash
	Input (teks, gambar, video)	$0,30	$0,30	$0,030	$0,030	$0,15	$0,15
	Input Audio	$1	$1	$0,100	$0,100	$0,5	$0,5
	Output teks (respons dan penalaran)	$2,50	$2,50	T/A	T/A	$1.25	$1.25
	Output gambar***	$30	$30	T/A	T/A	$15	$15
Live API Gemini 2.5 Flash
	1 juta token teks input	$0,5	$0,5	T/A	T/A	T/A	T/A
	1 juta token audio input	$3	$3	T/A	T/A	T/A	T/A
	1 juta token video/gambar input	$3	$3	T/A	T/A	T/A	T/A
	1 juta token teks output	$2	$2	T/A	T/A	T/A	T/A
	1 juta token audio output	$12	$12	T/A	T/A	T/A	T/A
Gemini 2.5 Flash Lite
	Input (teks, gambar, video)	$0,1	$0,1	$0,010	$0,010	$0,05	$0,05
	Input Audio	$0,3	$0,3	$0,030	$0,030	$0,15	$0,15
	Output teks (respons dan penalaran)	$0,4	$0,4	T/A	T/A	$0,2	$0,2
Grounding dengan Google Penelusuran	Gemini 2.0 Flash, 2.5 Flash,dan 2.5 Flash-Lite mencakup gabungan 1.500 perintah yang dirujuk per hari tanpa biaya tambahan. Gemini 2.5 Pro mencakup 10.000 perintah yang dirujukkan per hari tanpa biaya tambahan. Perintah yang dirujukkan yang melebihi batas tersebut akan ditagih sebesar $35 per 1.000 perintah yang dirujukkan. Perintah grounding adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Google Penelusuran&ast;&ast;. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.
Grounding Web untuk perusahaan	$45 per 1.000 perintah yang dirujukkan. Perintah yang dirujukkan adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Perujukan Web untuk perusahaan**. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.
Grounding dengan data Anda	$2,5 per 1.000 permintaan.
Grounding dengan Google Maps	$25 per 1.000 perintah yang dirujukkan. Perintah yang dirujukkan adalah permintaan yang dikirim ke Gemini yang membuat setidaknya 1 kueri ke Google Maps.

* Jika konteks input kueri lebih panjang dari 200 ribu token, semua token (input dan output) akan dikenai biaya dengan tarif konteks panjang.
** Perujukan dengan Google Penelusuran dan Perujukan Web untuk perusahaan hanya ditagih jika perintah berhasil menampilkan hasil web (yaitu, hasil yang berisi setidaknya satu URL dukungan perujukan dari web). Biaya penggunaan model Gemini berlaku secara terpisah.
*** Gambar 1024x1024 menggunakan 1.290 token. Jumlah token per gambar bervariasi menurut resolusi gambar. Untuk informasi selengkapnya tentang cara menghitung token, Anda dapat merujuk ke dokumentasi kami.
**** Penagihan Penggunaan Komputer menggunakan SKU Gemini 2.5 Pro, untuk memisahkan biaya Penggunaan Komputer, terapkan tag penagihan. Lihat selengkapnya di sini.

Penjelasan penagihan Jendela Konteks Sesi LiveAPI: Anda akan dikenai biaya per giliran untuk semua token yang ada di Jendela Konteks Sesi. Jendela Konteks Sesi mencakup token baru (giliran saat ini) + semua token yang terakumulasi dari giliran sebelumnya. Artinya, token dari giliran sebelumnya diproses ulang dan diperhitungkan dalam setiap giliran baru, hingga ukuran jendela konteks yang Anda konfigurasi. "Turn" adalah satu input pengguna dan respons model.
Mode Audio Proaktif: Jika diaktifkan, token input akan dikenai biaya saat LiveAPI mendengarkan. Token output hanya dikenakan biaya saat API merespons.
Jika transkripsi audio ke teks diaktifkan, semua token teks yang dihasilkan untuk transkripsi akan dikenai biaya sesuai tarif output token teks.

Gemini 2.0

Gemini 2.0 ditagih berdasarkan token. Untuk menghitung jumlah token input dalam permintaan Anda sebelum mengirim permintaan, Anda dapat menggunakan tokenizer SDK atau countTokens API. Jika permintaan Anda gagal dengan error 400 atau 500, Anda tidak akan dikenai biaya untuk token yang digunakan.

Gunakan tombol di tabel harga untuk membandingkan harga berbasis token dan harga berbasis modalitas.

Harga berbasis token

Model	Jenis	Harga	Harga dengan Batch API
Gemini 2.0 Flash
	1 Juta token Input	$0,15	$0,075
	1 juta token audio Input	$1,00	$0,50
	1 Juta token teks output	$0,60	$0,30
	Penyesuaian untuk 1 juta token pelatihan	$3,00
Pembuatan Gambar Gemini 2.0 Flash
	1 juta token input	$0,15
	1 juta token audio input	$1,00
	1 juta token video input	$3
	1 juta token teks output	$0,60
	1 juta token gambar output	$30,00
Gemini 2.0 Flash Live API
	1 juta token teks input	$0,5
	1 juta token audio input	$3
	1 juta token video/gambar input	$3
	1 juta token teks output	$2
	1 juta token audio output	$12
Gemini 2.0 Flash Lite
	1 Juta token Input	$0,075	$0,0375
	1 juta token audio Input	$0,075	$0,0375
	1 Juta token teks output	$0,30	$0,15
	Penyesuaian untuk 1 juta token pelatihan	$1,00
Grounding dengan Google Penelusuran	Gemini 2.0 Flash dan 2.5 Flash mencakup gabungan 1.500 perintah yang dirujuk per hari tanpa biaya tambahan. Perintah yang dirujukkan yang melebihi batas tersebut akan ditagih sebesar $35 per 1.000 perintah yang dirujukkan. Perintah yang dirujuk adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Google Penelusuran*. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.
Grounding Web untuk perusahaan	$45 per 1.000 perintah yang dirujukkan. Perintah yang dirujukkan adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Perujukan Web untuk perusahaan*. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.
Grounding dengan data Anda	$2,5 per 1.000 permintaan mulai 16 Juni 2025.
Grounding dengan Google Maps	Model Gemini menyertakan sejumlah perintah rujukan harian tanpa biaya tambahan: Gemini Flash dan Flash-Lite: gabungan 1.500 perintah yang dirujuk per hari. Gemini Pro: 10.000 perintah yang dirujuk per hari. Perintah yang dirujukkan yang melebihi batas tersebut akan ditagih sebesar $25 per 1.000 perintah yang dirujukkan. Perintah yang dirujukkan adalah permintaan yang dikirim ke Gemini yang membuat setidaknya 1 kueri ke Google Maps. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.

Harga berbasis modalitas

Harga modalitas di bawah ini didasarkan pada kasus penggunaan rata-rata sebagai referensi saja. Penagihan sebenarnya hanya akan didasarkan pada token:

4 karakter menghasilkan sekitar 1 token teks termasuk spasi kosong.

Untuk gambar 1024x1024, token yang digunakan adalah 1.290. Jumlah token per gambar bervariasi menurut resolusi gambar. Untuk informasi selengkapnya tentang cara menghitung token, Anda dapat merujuk ke dokumentasi kami.

Input video menggunakan 258 token per detik pada kecepatan sampel satu frame per detik. Video dengan audio dikenai biaya untuk token video dan token audio.

Input audio menggunakan 25 token per detik tanpa stempel waktu.

Model	Jenis	Harga	Harga dengan Batch API
Gemini 2.0 Flash
	Teks input ($/juta karakter)	$0,0375	$0,01875
	Gambar input ($/gambar)	$0,0001935	$0,00009675
	Video input ($/dtk)	$0,0000387	$0,00001935
	Input audio ($/detik)	$0,000025	$0,0000125
	Teks output ($/juta karakter)	$0,15	$0,075
Pembuatan Gambar Gemini 2.0 Flash
	Teks input ($/juta karakter)	$0,0375
	Gambar input ($/gambar)	$0,0001935
	Video input ($/dtk)	$0,0000387
	Input audio ($/detik)	$0,000025
	Teks output ($/juta karakter)	$0,15
	Gambar output gambar ($/gambar)	$0,04
Gemini 2.0 Flash Lite
	Teks input ($/juta karakter)	$0,01875	$0,009375
	Gambar input ($/gambar)	$0,00009675	$0,000048375
	Video input ($/dtk)	$0,00001935	$0,000009675
	Input audio ($/detik)	$0,000001875	$0,000000938
	Teks output ($/juta karakter)	$0,075	$0,0375
Grounding dengan Google Penelusuran	Gemini 2.0 Flash dan 2.5 Flash mencakup gabungan 1.500 perintah yang dirujuk per hari tanpa biaya tambahan. Perintah yang dirujukkan yang melebihi batas tersebut akan ditagih sebesar $35 per 1.000 perintah yang dirujukkan. Perintah yang dirujuk adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Google Penelusuran*. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.
Grounding Web untuk perusahaan	$45 per 1.000 perintah yang dirujukkan. Perintah yang dirujukkan adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Perujukan Web untuk perusahaan*. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.

* Harga tercantum dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
* Token pelatihan dihitung berdasarkan jumlah total token dalam set data pelatihan Anda, dikalikan dengan jumlah epoch Anda.
* PDF ditagih sebagai input gambar, dengan satu halaman PDF setara dengan satu gambar.
* Endpoint model yang disesuaikan memiliki harga prediksi yang sama dengan model dasar.
* Perujukan dengan Google Penelusuran dan Perujukan Web untuk perusahaan hanya ditagih jika perintah berhasil menampilkan hasil web (yaitu, hasil yang berisi setidaknya satu URL dukungan perujukan dari web). Biaya penggunaan model Gemini berlaku secara terpisah.
* Gemini 2.0 Flash Live API: 25 token per detik audio (input/output), 258 token per detik video (input). Grounding dengan Google Penelusuran tetap gratis selama Gemini 2.0 Flash Live API dalam Pratinjau.

Penjelasan penagihan Jendela Konteks Sesi LiveAPI: Anda akan dikenai biaya per giliran untuk semua token yang ada di Jendela Konteks Sesi. Jendela Konteks Sesi mencakup token baru (giliran saat ini) + semua token yang terakumulasi dari giliran sebelumnya. Artinya, token dari giliran sebelumnya diproses ulang dan diperhitungkan dalam setiap giliran baru, hingga ukuran jendela konteks yang Anda konfigurasi. "Turn" adalah satu input pengguna dan respons model.
Jika transkripsi audio ke teks diaktifkan, semua token teks yang dihasilkan untuk transkripsi akan dikenai biaya sesuai tarif output token teks.

Harga Pengoptimal Model Vertex AI (Eksperimental)*

Pengoptimal Model Vertex AI menyederhanakan penggunaan Gemini untuk pelanggan perusahaan dengan menyediakan satu meta-endpoint untuk permintaan model Gemini. Pelanggan yang menggunakan layanan ini tidak perlu menentukan apakah akan menggunakan Flash, Pro, atau versi tertentu. Pengguna hanya perlu memberikan setelan yang dapat dikonfigurasi (biaya, kualitas, atau keseimbangan) untuk menunjukkan preferensi mereka, dan Model Optimizer akan menerapkan tingkat kecerdasan yang tepat untuk tugas tersebut dengan mengirimkan setiap kueri ke model yang paling sesuai.

Vertex AI Model Optimizer menerapkan harga dinamis. Artinya, harga rata-rata per token bergantung pada tingkat kecerdasan model yang diterapkan untuk menyelesaikan tugas. Oleh karena itu, contoh harga disediakan di bawah untuk mengilustrasikan kemungkinan skenario berdasarkan setelan konfigurasi Anda (lihat tabel di bawah). SKU Model Optimizer adalah SKU $1 yang berfungsi sebagai unit pembelian untuk diterapkan pada penagihan Anda. Anda tetap akan ditagih berdasarkan konsumsi setelah menggunakan model.

Rasio I/O 5:1	Contoh 1 bot chat	CATATAN: rentang ini bukan jaminan, hasil pelanggan individu dapat bervariasi
Preferensi Pelanggan	Token Input Pelanggan Dikirim ke MO	Token Output Pelanggan Dikirim ke MO	Harga Input Rata-Rata per Juta Token (Rentang Tinggi)	Harga Output Rata-Rata per Juta Token (Rentang Tinggi)	Harga Input Rata-Rata per Juta Token (Rentang Rendah)	Harga Output Rata-Rata per Juta Token (Rentang Rendah)
Biaya	10.000.000	2.000.000	$0,63	$2,50	$0,16	$0,63
Seimbang	10.000.000	2.000.000	$1,26	$5,00	$0,63	$2,50
Kualitas	10.000.000	2.000.000	$1,89	$7,50	$1,26	$5,00

Rasio I/O 1:20	Contoh 2 Pembuatan konten
Preferensi Pelanggan	Token Input Pelanggan Dikirim ke MO	Token Output Pelanggan Dikirim ke MO	Harga Input Rata-Rata per Juta Token (Rentang Tinggi)	Harga Output Rata-Rata per Juta Token (Rentang Tinggi)	Harga Input Rata-Rata per Juta Token (Rentang Rendah)	Harga Output Rata-Rata per Juta Token (Rentang Rendah)
Biaya	1.000.000	20.000.000	$0,63	$2,50	$0,16	$0,63
Seimbang	1.000.000	20.000.000	$1,26	$5,00	$0,63	$2,50
Kualitas	1.000.000	20.000.000	$1,89	$7,50	$1,26	$5,00

* Model Optimizer adalah penawaran eksperimental berbayar, dan dapat merutekan permintaan ke versi eksperimental Gemini di Vertex.

Model Gemini lainnya

Semua model Gemini selain Gemini 2.0 atau Gemini 2.5 ditagih berdasarkan modalitas seperti karakter, gambar, detik video/audio. Input teks dikenakan biaya per 1.000 karakter input (perintah) dan per 1.000 karakter output (respons). Karakter dihitung berdasarkan poin kode UTF-8 dan spasi dikecualikan dari hitungan, sehingga menghasilkan sekitar 4 karakter per token. Permintaan prediksi yang menghasilkan respons yang difilter hanya dikenakan biaya untuk input. Pada akhir setiap siklus penagihan, pecahan dari satu sen ($0,01) dibulatkan menjadi satu sen. Input media dikenai biaya per gambar atau per detik (video). Jika permintaan Anda gagal dengan error 400 atau 500, Anda tidak akan dikenai biaya untuk token yang digunakan.

Model	Fitur	Jenis	Harga ( =< 128 ribu token input)	Harga ( > 128 ribu token input)
Gemini 1.5 Flash	Multimodal	Input Gambar Input Video Input Teks Input Audio	$0,00002 / gambar $0,00002 / detik $0,00001875 / 1.000 karakter $0,000002 / detik	$0,00004 / gambar $0,00004 / detik $0,0000375 / 1.000 karakter $0,000004 / detik
		Output Teks	$0,000075 / 1.000 karakter	$0,00015 / 1.000 karakter
	Penyesuaian*	Token Pelatihan	$8 / 1 juta token
Gemini 1.5 Pro	Multimodal	Input Gambar Input Video Input Teks Input Audio	$0,00032875 / gambar $0,00032875 / detik $0,0003125 / 1.000 karakter $0,00003125 / detik	$0,0006575 / gambar $0,0006575 / detik $0,000625 / 1 ribu karakter $0,0000625 / detik
		Output Teks	$0,00125 / 1.000 karakter	$0,0025 / 1.000 karakter
	Penyesuaian*	Token Pelatihan	$80 / Jt token
Gemini 1.0 Pro	Multimodal	Input Gambar Input Video Input Teks	$0,0025 / gambar $0,002 / detik $0,000125 / 1.000 karakter
Gemini 1.0 Pro		Output Teks	$0,000375 / 1.000 karakter
Grounding dengan Google Penelusuran	Teks	$35 per 1.000 perintah yang dirujukkan. Perintah yang dirujuk adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Google Penelusuran*. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.
Grounding Web untuk perusahaan	Teks	$45 per 1.000 perintah yang dirujukkan. Perintah yang dirujuk adalah permintaan yang dikirimkan ke Gemini yang membuat satu atau beberapa kueri ke Perujukan Web untuk perusahaan*. Meskipun beberapa kueri penelusuran dikirim ke Google Penelusuran, hanya ada satu biaya untuk perintah yang dirujuk. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta perintah yang dirujukkan per hari.
Grounding dengan data Anda	Teks	$2,5 per 1.000 permintaan mulai 16 Juni 2025.

* Harga tercantum dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
* Jika konteks kueri lebih panjang dari 128 ribu, semua token akan dikenai biaya dengan tarif konteks panjang.
* Model Gemini tersedia dalam mode batch dengan diskon 50%.
* Gemini 1.0 Pro hanya mendukung jendela konteks hingga 32 ribu.
* PDF ditagih sebagai input gambar, dengan satu halaman PDF setara dengan satu gambar.
* Endpoint model yang disesuaikan memiliki harga prediksi yang sama dengan model dasar.
* Perujukan dengan Google Penelusuran dan Perujukan Web untuk perusahaan hanya ditagih jika perintah berhasil menampilkan hasil web (yaitu, hasil yang berisi setidaknya satu URL dukungan perujukan dari web). Biaya penggunaan model Gemini berlaku secara terpisah.

Imagen

Dengan Imagen di Vertex AI, Anda dapat menghasilkan gambar baru dan mengedit gambar berdasarkan perintah teks yang Anda sediakan, atau hanya mengedit bagian gambar menggunakan area mask yang Anda tentukan bersama dengan sejumlah kemampuan lainnya.

Model	Fitur	Deskripsi	Input	Output	Harga
Imagen 4 Ultra	Pembuatan gambar	Buat gambar	Perintah teks	Gambar	$0,06 per gambar
Imagen 4	Peningkatan resolusi	Meningkatkan resolusi gambar yang dihasilkan menjadi 2K, 3K, dan 4K	Gambar	Gambar	$0,06 per gambar
Imagen 4	Pembuatan gambar	Buat gambar	Perintah teks	Gambar	$0,04 per gambar
Imagen 4 Fast	Pembuatan gambar	Buat gambar	Perintah teks	Gambar	$0,02 per gambar
Imagen 3	Pembuatan gambar	Buat gambar Edit gambar Sesuaikan gambar	Perintah teks	Gambar	$0,04 per gambar
Imagen 3 Fast	Pembuatan gambar	Buat gambar	Perintah teks	Gambar	$0,02 per gambar
Imagen 2, Imagen 1	Pembuatan gambar	Buat gambar	Perintah teks	Gambar	$0,020 per gambar
Imagen 2, Imagen 1	Pengeditan gambar	Mengedit gambar menggunakan pendekatan mask atau tanpa mask	Perintah Gambar/Teks	Gambar	$0,020 per gambar
Imagen 1	Peningkatan resolusi	Meningkatkan resolusi gambar yang dihasilkan menjadi 2k dan 4k	Gambar	Gambar	$0,003 per gambar
Imagen 1	Fine tuning	Mengaktifkan "subjek" yang disediakan oleh pengguna untuk digunakan dalam prompt Imagen (beberapa pelatihan pengambilan gambar)	Subjek dengan ID teks dan 4-8 gambar per subjek	Model yang telah melalui fine tuning (setelah pelatihan dengan subjek yang disediakan pengguna)	$ per jam kerja node (harga pelatihan kustom Vertex AI)
Imagen	Teks Keterangan Visual	Membuat teks singkat atau panjang untuk gambar	Gambar	Teks keterangan	$0,0015/gambar
Imagen	Tanya Jawab Visual	Memberikan jawaban berdasarkan pertanyaan yang merujuk ke gambar	Perintah Gambar/Teks	Jawaban teks	$0,0015/gambar
Imagen	Rekontekstualisasi Produk	Membayangkan kembali produk dalam adegan baru	1-3 Gambar produk yang sama dan perintah teks yang menjelaskan adegan yang diinginkan	Gambar	$0,12 per gambar
	Vertex Virtual Try-On	Buat gambar orang yang mengenakan pakaian berbeda	1 gambar orang dan 1 gambar pakaian	Gambar	$0,06 per gambar

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.

Veo

Veo membuat video berkualitas sangat tinggi dalam berbagai subjek dan gaya, dengan pemahaman yang lebih baik tentang fisika dunia nyata serta nuansa gerakan dan ekspresi manusia.

Model	Fitur	Deskripsi	Input	Output	Resolusi Output	Harga
Veo 3.1	Pembuatan Video + Audio	Buat video berkualitas tinggi dengan efek suara/ucapan yang disinkronkan dari perintah teks atau gambar referensi	Perintah Teks/Gambar	Video + Audio	720p, 1080p	$0,40/detik
Veo 3.1	Pembuatan video	Buat video berkualitas tinggi dari perintah teks atau gambar referensi	Perintah Teks/Gambar	Video	720p, 1080p	$0,20/detik
Veo 3.1 Fast	Pembuatan Video + Audio	Buat video dengan efek suara/ucapan yang disinkronkan dari perintah teks atau gambar referensi dengan lebih cepat	Perintah Teks/Gambar	Video + Audio	720p, 1080p	$0,15/detik
Veo 3.1 Fast	Pembuatan video	Buat video dari perintah teks atau gambar referensi dengan lebih cepat	Perintah Teks/Gambar	Video	720p, 1080p	$0,10/detik
Veo 3	Pembuatan Video + Audio	Buat video berkualitas tinggi dengan efek suara/ucapan yang disinkronkan dari perintah teks atau gambar referensi	Perintah Teks/Gambar	Video + Audio	720p, 1080p	$0,40/detik
Veo 3	Pembuatan video	Buat video berkualitas tinggi dari perintah teks atau gambar referensi	Perintah Teks/Gambar	Video	720p, 1080p	$0,20/detik
Veo 3 Fast	Pembuatan Video + Audio	Buat video dengan efek suara/ucapan yang disinkronkan dari perintah teks atau gambar referensi dengan lebih cepat	Perintah Teks/Gambar	Video + Audio	720p, 1080p	$0,15/detik
Veo 3 Fast	Pembuatan video	Buat video dari perintah teks atau gambar referensi dengan lebih cepat	Perintah Teks/Gambar	Video	720p, 1080p	$0,10/detik
Veo 2	Pembuatan video	Buat video dari perintah teks atau gambar referensi	Perintah Teks/Gambar	Video	720p	$0,50/detik
Veo 2	Kontrol Lanjutan	Buat video melalui interpolasi frame awal dan akhir, perpanjang video yang dibuat, dan terapkan kontrol kamera	Perintah Teks/Gambar/Video	Video	720p	$0,50/detik

Lyria

Lyria 2 menawarkan pembuatan musik instrumental berkualitas tinggi yang ideal untuk komposisi canggih dan eksplorasi kreatif mendetail yang mengutamakan output bernuansa.

Model	Fitur	Deskripsi	Input	Output	Harga
Lyria 2	Pembuatan musik	Membuat musik dari perintah teks	Perintah teks	Musik	$0,06 per 30 detik

Memahami biaya embedding untuk aplikasi AI Anda

Model	Jenis	Region	Harga per 1.000 token input
Gemini Embedding	Input	Global	Permintaan online: $0,00015 Permintaan batch: $0,00012
Gemini Embedding	Output	Global	Permintaan online: Tanpa biaya Permintaan batch: Tanpa biaya

Model	Jenis	Region	Harga per 1.000 karakter
Embedding untuk Teks (Tidak termasuk Gemini Embedding)	Input	Global	Permintaan online: $0,000025 Permintaan batch: $0,00002
Embedding untuk Teks (Tidak termasuk Gemini Embedding)	Output	Global	Permintaan online: Tanpa biaya Permintaan batch: Tanpa biaya

Model	Fitur	Deskripsi	Input	Output	Harga
multimodalembedding	Embedding untuk Multimodal: Teks	Membuat embedding menggunakan teks sebagai input	Teks	Embedding	$0,0002 / 1.000 input karakter
	Embedding untuk Multimodal: Gambar	Membuat embedding menggunakan gambar sebagai input	Gambar	Embedding	$0,0001 / input gambar
	Embedding untuk Multimodal: Video Plus	Video Plus	Video	Embedding (hingga 15 embedding per menit video)	$0,0020 per detik video
	Embeddings for Multimodal: Video Standard	Video Standar	Video	Embeddings (hingga 8 embeddings per menit video)	$0,0010 per detik video
	Embedding untuk Multimodal: Video Essential	Video Essential	Video	Embedding (hingga 4 embedding per menit video)	$0,0005 per detik video

Model Open Source	Jenis	Harga per 1.000 token input
multilingual-e5-small	Input: Output: Input Batch: Output Batch:	Permintaan online: $0,000015 Permintaan online: Tanpa biaya Permintaan batch: $0,0000075 Permintaan batch: Tanpa biaya
multilingual-e5-large	Input: Output: Input Batch: Output Batch:	Permintaan online: $0,000025 Permintaan online: Tanpa biaya Permintaan batch: $0,0000125 Permintaan batch: Tanpa biaya

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.

Harga untuk pelengkapan kode Vertex AI

AI Generatif di Vertex AI mengenakan biaya per 1.000 karakter input (perintah) dan per 1.000 karakter output (respons). Karakter dihitung berdasarkan poin kode UTF-8 dan spasi dikecualikan dari hitungan. Selama tahap Pratinjau, tagihan didiskon 100%. Permintaan prediksi yang menghasilkan respons yang difilter hanya dikenakan biaya untuk input. Pada akhir setiap siklus penagihan, pecahan dari satu sen ($0,01) dibulatkan menjadi satu sen.

Model	Jenis	Region	Harga per 1.000 karakter
Codey untuk Penyelesaian kode	Input	Global	Permintaan online: $0,00025
Codey untuk Penyelesaian kode	Output	Global	Permintaan online: $0,0005

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda di SKU Cloud Platform.

Terjemahan (Teks)

Menggunakan Vertex AI API dan LLM Terjemahan untuk menerjemahkan teks. Terjemahan LLM cenderung lebih lancar dan terdengar seperti manusia dibandingkan model terjemahan klasik, tetapi dukungan bahasanya lebih terbatas (Pelajari Lebih Lanjut).

Model	Metode	Penggunaan	Harga per juta karakter
LLM	Terjemahan teks^*	Jumlah karakter input per bulan	$10 per juta karakter^*
	Terjemahan teks^*	Jumlah karakter output per bulan	$10 per juta karakter^*

Biaya dicantumkan dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
^*Harga dihitung per karakter yang diproses oleh model. Untuk mengetahui detail tentang karakter yang dihitung, lihat Karakter yang dikenakan biaya

Harga Penyimpanan Cache Konteks untuk Explicit Caching

Model	Fitur	Jenis	Harga (/1 juta token) <= 200 ribu token input	Harga (/1 juta token) > 200 ribu token input
Gemini 3 Pro	Penyimpanan Cache Konteks	Input (teks, gambar, video, audio)	$4,5 (/Jt Token/jam)	$4,5 (/Jt Token/jam)
Gemini 2.5 Pro	Penyimpanan Cache Konteks	Input (teks, gambar, video, audio)	$4,5 (/Jt Token/jam)	$4,5 (/Jt Token/jam)
Gemini 2.5 Flash	Penyimpanan Cache Konteks	Input (teks, gambar, video, audio)	$1 (/M Token/jam)	$1 (/M Token/jam)
Gemini 2.5 Flash Lite	Penyimpanan Cache Konteks	Input (teks, gambar, video, audio)	$1 (/M Token/jam)	$1 (/M Token/jam)

Model Gemini 2.0

Harga berbasis token

Model	Jenis	Penyimpanan (juta token-jam)	Harga
Gemini 2.0 Flash
	1 Juta token Input	$1,00	$0,0375
	1 juta token audio Input	$1,00	$0,25
	1 Juta token teks output	NA	NA
Gemini 2.0 Flash Lite
	1 Juta token Input	$1,00	$0,01875
	1 juta token audio Input	$1,00	$0,01875
	1 Juta token teks output	NA	NA

Harga berbasis modalitas

Harga modalitas di bawah ini didasarkan pada kasus penggunaan rata-rata sebagai referensi saja. Penagihan sebenarnya hanya akan didasarkan pada token:

4 karakter menghasilkan sekitar 1 token teks termasuk spasi kosong.

Input video menggunakan 258 token per detik pada kecepatan sampel satu frame per detik. Video dengan audio dikenai biaya untuk token video dan token audio.

Input audio menggunakan 25 token per detik tanpa stempel waktu.

Model	Jenis	Penyimpanan (Jam Modalitas)	Harga
Gemini 2.0 Flash
	Teks input ($/juta karakter)	$0,25	$0,009375
	Gambar input ($/gambar)	$0,00129	$0,000048375
	Video input ($/dtk)	$0,000258	$0,000009675
	Input audio ($/detik)	$0,000025	$0,00000625
	Teks output ($/juta karakter)	NA	NA
Gemini 2.0 Flash Lite
	Teks input ($/juta karakter)	$0,25	$0,0046875
	Gambar input ($/gambar)	$0,00129	$0,0000241875
	Video input ($/dtk)	$0,000258	$0,000009675
	Input audio ($/detik)	$0,000258	$0,0000048375
	Teks output ($/juta karakter)	NA	NA
Grounding dengan Google Penelusuran	Gemini 2.0 Flash mencakup hingga 1.500 permintaan berdasar per hari tanpa biaya tambahan. Permintaan yang dirujuk melebihi 1.500 per hari akan dikenai biaya $35 per 1.000 permintaan (hingga 1 juta permintaan per hari). Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta permintaan per hari.
Grounding Web untuk perusahaan	$45 per 1.000 permintaan (hingga 1 juta permintaan per hari) mulai 5 Mei 2025. Hubungi tim akun Anda jika Anda memerlukan lebih dari 1 juta permintaan per hari.

* Harga tercantum dalam Dolar AS (USD). Jika Anda melakukan pembayaran dengan mata uang selain USD, yang berlaku adalah harga yang tercantum dalam mata uang Anda pada SKU Cloud Platform.
* PDF ditagih sebagai input gambar, dengan satu halaman PDF setara dengan satu gambar.
* Endpoint model yang disesuaikan memiliki harga prediksi yang sama dengan model dasar.
* Perujukan dengan Google Penelusuran hanya ditagih untuk permintaan yang menampilkan hasil yang berisi setidaknya satu URL dukungan perujukan dari web. Biaya penggunaan model Gemini standar juga berlaku.

Throughput yang Disediakan

Throughput yang disediakan menjamin throughput untuk kebutuhan AI generatif Anda dan ditransaksikan melalui unit skala AI generatif, atau GSU. Pelajari lebih lanjut throughput yang disediakan setiap GSU di sini dan gunakan alat estimasi online kami di sini.

Durasi	Harga per GSU	Per
Komitmen 1 minggu	$1.200	Minggu
Komitmen 1 bulan	$2.700	Bulan
Komitmen 3 bulan	$2.400	Bulan
Komitmen 1 tahun	$2.000	Bulan

Contoh penghitungan biaya

Seorang pengguna perlu memastikan bahwa mereka dapat mendukung 10 kueri per detik (QPS) dari kueri dengan input 1.000 token teks dan 500 token audio serta menerima output 300 token teks menggunakan gemini-2.0-flash.

Menggunakan tabel throughput dan laju penurunan, untuk gemini-2.0-flash, kita tahu laju penurunan token teks input adalah 1 token, laju penurunan token audio input adalah 7 token, dan laju penurunan token teks output adalah 4 token.

Total token input pengguna adalah 1.000* (1 token per token teks input) + 500* (7 token per token audio input) = 4.500 token input yang disesuaikan dengan burndown. Total token output pengguna adalah 300* (4 token per token teks output) = 1.200 token output yang disesuaikan dengan burndown. Jika dijumlahkan, kita mendapatkan 4.500 token input yang disesuaikan dengan burndown + 1.200 token output yang disesuaikan dengan burndown = 5.700 total token per kueri.

Dengan mengalikan total token per kueri dengan QPS, kita mendapatkan 5.700 total token per kueri * 10 QPS = 57.000 total token per detik.

Dengan membagi angka ini dengan total throughput per detik per GSU,kita mendapatkan 57.000 total token per detik ÷ 3.360 throughput per detik per GSU = 16,96 GSU. Peningkatan pembelian GSU minimum untuk model ini adalah 1, sehingga pengguna memerlukan 17 GSU.

Jika pengguna ingin mempertahankan throughput ini selama 1 minggu, biayanya adalah $1.200 * 17 GSU = $20.400 per minggu. Jika mereka ingin mempertahankan throughput ini selama 1 bulan, biayanya adalah $2.700 * 17 GSU = $45.900 per bulan. Jika mereka ingin mempertahankan throughput ini selama 3 bulan, biayanya adalah $2.400 * 17 GSU = $40.800 per bulan. Terakhir, jika mereka ingin mempertahankan throughput ini selama 1 tahun, biayanya adalah $2.000 * 17 GSU = $34.000 per bulan.

Penyesuaian Model

Penyesuaian model adalah cara efektif untuk menyesuaikan model besar dengan tugas Anda. Langkah ini penting untuk meningkatkan kualitas dan efisiensi model. Penyesuaian model memberikan manfaat berikut:

Kualitas lebih tinggi untuk tugas spesifik Anda
Peningkatan ketahanan model
Latensi dan biaya inferensi lebih rendah karena perintah yang lebih pendek

Penyesuaian dikenakan biaya per juta token pelatihan. Token pelatihan dihitung berdasarkan total jumlah token dalam set data pelatihan Anda, dikalikan dengan jumlah epoch Anda. Untuk inferensi model, endpoint model yang disesuaikan Gemini memiliki harga prediksi yang sama dengan model dasar.

Model	Jenis	Harga (/1 juta token pelatihan)
Gemini 2.5 Pro	Penyesuaian yang diawasi	$25
Gemini 2.5 Flash	Penyesuaian yang diawasi Penyesuaian preferensi	$5
Gemini 2.5 Flash Lite	Penyesuaian yang diawasi Penyesuaian preferensi	$1,5
Gemma 3 27B IT	Penyesuaian yang diawasi	$6,83
Llama 3.1 8B	Penyesuaian yang diawasi	$0,67
Llama 3.2 1B	Penyesuaian yang diawasi	$0,28
Llama 3.2 3B	Penyesuaian yang diawasi	$0,61
Llama 3.3 70B	Penyesuaian yang diawasi	$6,72
Llama 4 Scout 17B 16E	Penyesuaian yang diawasi	$5,77
Qwen 3 32B	Penyesuaian yang diawasi	$6,57

* Token pelatihan dihitung berdasarkan jumlah total token dalam set data pelatihan Anda, dikalikan dengan jumlah epoch Anda.
* Endpoint model Gemini yang disesuaikan memiliki harga prediksi yang sama dengan model dasar.

Membandingkan harga model partner di Vertex AI

Model partner adalah daftar model AI generatif pilihan yang dikembangkan oleh partner Google. Model partner ditawarkan sebagai API terkelola. Untuk mengetahui informasi lebih lanjut, lihat Ringkasan model partner. Bagian berikut mencantumkan detail harga untuk model partner Google.

Model AI21 Lab

Model	Harga
Jamba 1.5 Large (Tidak digunakan lagi)	Input: $2 / juta token Output: $8 / juta token
Jamba 1.5 Mini (Tidak digunakan lagi)	Input: $0,20 / juta token Output: $0,40 / juta token

Model Claude dari Anthropic

Model dengan harga regional

Global

Model	Harga (/1 juta token) < 200 ribu token input	Harga (/1 juta token) >= 200 ribu token input
Claude Opus 4.5	Input: $5,00 Output: $25,00 Input Batch: $2,50 Output Batch: $12,50 Penulisan Cache 5 mnt: $6,25 Penulisan Cache 1 jam: $10,00 Cache Hit: $0,50 Penulisan Cache Batch 5 mnt: $3,125 Penulisan Cache Batch 1 jam: $5,00 Cache Hit Batch: $0,25
Claude Sonnet 4.5	Input: $3,00 Output: $15,00 Input Batch: $1,50 Output Batch: $7,50 Penulisan Cache 5 mnt: $3,75 Penulisan Cache 1 jam: $6,00 Cache Hit: $0,30 Penulisan Cache Batch: $1,88 Cache Hit Batch: $0,15	Input: $6,00 Output: $22,50 Input Batch: $3,00 Output Batch: $11,25 Penulisan Cache 5 mnt: $7,50 Penulisan Cache 1 jam: $12,00 Cache Hit: $0,60 Penulisan Cache Batch: $3,75 Cache Hit Batch: $0,30
Claude Haiku 4.5	Input: $1,00 Output: $5,00 Input Batch: $0,50 Output Batch: $2,50 Penulisan Cache 5 mnt: $1,25 Penulisan Cache 1 jam: $2,00 Cache Hit: $0,10 Penulisan Cache Batch: $0,625 Cache Hit Batch: $0,05

us-east5

Model	Harga (/1 juta token) < 200 ribu token input	Harga (/1 juta token) >= 200 ribu token input
Claude Opus 4.5	Input: $5,50 Output: $27,50 Input Batch: $2,75 Output Batch: $13,75 Penulisan Cache 5 mnt: $6,875 Penulisan Cache 1 jam: $11,00 Cache Hit: $0,55 Penulisan Cache Batch 5 mnt: $3,438 Penulisan Cache Batch 1 jam: $5,50 Cache Hit Batch: $0,275
Claude Sonnet 4.5	Input: $3,30 Output: $16,50 Input Batch: $1,65 Output Batch: $8,25 Penulisan Cache 5 menit: $4,13 Penulisan Cache 1 jam: $6,60 Cache Hit: $0,33 Penulisan Cache Batch: $2,06 Cache Hit Batch: $0,17	Input: $6,60 Output: $24,75 Input Batch: $3,30 Output Batch: $12,38 Penulisan Cache 5 menit: $8,25 Penulisan Cache 1 jam: $13,20 Cache Hit: $0,66 Penulisan Cache Batch: $4,13 Cache Hit Batch: $0,33
Claude Haiku 4.5	Input: $1,10 Output: $5,50 Input Batch: $0,55 Output Batch: $2,75 Penulisan Cache 5 mnt: $1,375 Penulisan Cache 1 jam: $2,20 Penulisan Cache: $1,375 Cache Hit: $0,11 Penulisan Cache Batch: $0,688 Cache Hit Batch: $0,055

europe-west1

Model	Harga (/1 juta token) < 200 ribu token input	Harga (/1 juta token) >= 200 ribu token input
Claude Opus 4.5	Input: $5,50 Output: $27,50 Input Batch: $2,75 Output Batch: $13,75 Penulisan Cache 5 mnt: $6,875 Penulisan Cache 1 jam: $11,00 Cache Hit: $0,55 Penulisan Cache Batch 5 mnt: $3,438 Penulisan Cache Batch 1 jam: $5,50 Cache Hit Batch: $0,275
Claude Sonnet 4.5	Input: $3,30 Output: $16,50 Input Batch: $1,65 Output Batch: $8,25 Penulisan Cache 5 menit: $4,13 Penulisan Cache 1 jam: $6,60 Cache Hit: $0,33 Penulisan Cache Batch: $2,06 Cache Hit Batch: $0,17	Input: $6,60 Output: $24,75 Input Batch: $3,30 Output Batch: $12,38 Penulisan Cache 5 menit: $8,25 Penulisan Cache 1 jam: $13,20 Cache Hit: $0,66 Penulisan Cache Batch: $4,13 Cache Hit Batch: $0,33
Claude Haiku 4.5	Input: $1,10 Output: $5,50 Input Batch: $0,55 Output Batch: $2,75 Penulisan Cache 5 menit: $1,375 Penulisan Cache 1 jam: $2,20 Cache Hit: $0,11 Penulisan Cache Batch: $0,688 Cache Hit Batch: $0,055

asia-southeast1

Model	Harga (/1 juta token) < 200 ribu token input	Harga (/1 juta token) >= 200 ribu token input
Claude Opus 4.5	Input: $5,50 Output: $27,50 Input Batch: $2,75 Output Batch: $13,75 Penulisan Cache 5 mnt: $6,875 Penulisan Cache 1 jam: $11,00 Cache Hit: $0,55 Penulisan Cache Batch 5 mnt: $3,438 Penulisan Cache Batch 1 jam: $5,50 Cache Hit Batch: $0,275
Claude Sonnet 4.5	Input: $3,30 Output: $16,50 Input Batch: $1,65 Output Batch: $8,25 Penulisan Cache 5 menit: $4,13 Penulisan Cache 1 jam: $6,60 Cache Hit: $0,33 Penulisan Cache Batch: $2,06 Cache Hit Batch: $0,17	Input: $6,60 Output: $24,75 Input Batch: $3,30 Output Batch: $12,38 Penulisan Cache 5 menit: $8,25 Penulisan Cache 1 jam: $13,20 Cache Hit: $0,66 Penulisan Cache Batch: $4,13 Cache Hit Batch: $0,33

asia-east1

Model	Harga (/1 juta token) < 200 ribu token input	Harga (/1 juta token) >= 200 ribu token input
Claude Haiku 4.5	Input: $1,10 Output: $5,50 Input Batch: $0,55 Output Batch: $2,75 Penulisan Cache 5 mnt: $1,375 Penulisan Cache 1 jam: $2,20 Penulisan Cache: $1,375 Cache Hit: $0,11 Penulisan Cache Batch: $0,688 Cache Hit Batch: $0,055

* Jika konteks input kueri lebih panjang dari atau sama dengan 200 ribu token, semua token (input dan output) akan dikenai biaya dengan tarif konteks panjang.

Model dengan harga seragam di semua region

Model	Harga (/1 juta token) < 200 ribu token input	Harga (/1 juta token) >= 200 ribu token input
Claude Opus 4.1	Input: $15 Output: $75 Input Batch: $7,50 Output Batch: $37,50 Penulisan Cache 5 mnt: $18,75 Penulisan Cache 1 jam: $30 Cache Hit: $1,50 Penulisan Cache Batch: $9,375 Cache Hit Batch: $0,75	T/A
Claude Opus 4	Input: $15 Output: $75 Input Batch: $7,50 Output Batch: $37,50 Penulisan Cache 5 menit: $18,75 Penulisan Cache 1 jam: $30 Cache Hit: $1,50 Penulisan Cache Batch: $9,375 Cache Hit Batch: $0,75	T/A
Claude Sonnet 4	Input: $3 Output: $15 Input Batch: $1,50 Output Batch: $7,50 Penulisan Cache 5 mnt: $3,75 Penulisan Cache 1 jam: $6,00 Cache Hit: $0,30 Penulisan Cache Batch: $1,875 Cache Hit Batch: $0,15	Input: $6 Output: $22,50 Input Batch: $3 Output Batch: $11,25 Penulisan Cache 5 menit: $7,50 Penulisan Cache 1 jam: $12,00 Cache Hit: $0,60 Penulisan Cache Batch: $3,75 Cache Hit Batch: $0,30
Claude 3 Haiku	Input: $0,25 Output: $1,25 5m Cache Write: $0,30 1h Cache Write: $0,50 Cache Hit: $0,03	T/A
Claude 3.5 Haiku (Tidak Digunakan Lagi)	Input: $0,80 Output: $4 Input Batch: $0,40 Output Batch: $2 Penulisan Cache 5 m: $1 Penulisan Cache 1 jam: $1,60 Cache Hit: $0,08 Penulisan Cache Batch: $0,50 Cache Hit Batch: $0,04	T/A
Claude 3.7 Sonnet (Tidak Digunakan Lagi)	Input: $3 Output: $15 Input Batch: $1,50 Output Batch: $7,50 Cache Write: $3,75 Cache Hit: $0,30 Cache Write Batch: $1,875 Cache Hit Batch: $0,15	T/A
Claude 3.5 Sonnet v2 (Tidak Digunakan Lagi)	Input: $3 Output: $15 Input Batch: $1,50 Output Batch: $7,50 Cache Write: $3,75 Cache Hit: $0,30 Cache Write Batch: $1,875 Cache Hit Batch: $0,15	T/A
Claude 3.5 Sonnet (Tidak Digunakan Lagi)	Input: $3 Output: $15 Cache Write: $3,75 Cache Hit: $0,30	T/A
Claude 3 Opus (Tidak digunakan lagi)	Input: $15 Output: $75 Cache Write: $18.75 Cache Hit: $1.50	T/A

* Jika konteks input kueri lebih panjang dari atau sama dengan 200 ribu token, semua token (input dan output) akan dikenai biaya dengan tarif konteks panjang.

Harga untuk alat

Alat	Harga
Permintaan Penelusuran Web	$10 per 1.000 penelusuran Model yang Didukung: Claude Haiku 4.5, Claude Sonnet 4.5, Claude Sonnet 4, Claude Opus 4.1, dan Claude Opus 4.

* Jika konteks input kueri lebih panjang dari atau sama dengan 200 ribu token, semua token (input dan output) akan dikenai biaya dengan tarif konteks panjang.

Model Deepseek

Model	Harga
DeepSeek-V3.1	Input: $0,60 / juta token Output: $1,70 / juta token Input Batch: $0,30 / juta token Output Batch: $0,85 / juta token
DeepSeek-V3.2 *	Input: $0,56 / juta token Output: $1,68 / juta token Input Batch: $0,28 / juta token Output Batch: $0,84 / juta token
DeepSeek-R1 (0528)	Input: $1,35 / juta token Output: $5,40 / juta token Input Batch: $0,675 / juta token Output Batch: $2,70 / juta token
DeepSeek-OCR	Input: $0,30 / juta token (atau $0,0003/halaman) Output: $1,20 / juta token (atau $0,00012/halaman)

Tersedia tanpa biaya hingga 17 Desember 2025.

Model MiniMax

Model	Harga
MiniMax-M2	Input: $0,30 / juta token Output: $1,20 / juta token

Model Moonshot

Model	Harga
Kimi-K2-Thinking	Input: $0,60 / juta token Output: $2,50 / juta token

Model Qwen

Model	Harga
Qwen3-Next-80B-Thinking	Input: $0,15 / juta token Output: $1,20 / juta token
Qwen3-Next-80B-Instruct	Input: $0,15 / juta token Output: $1,20 / juta token
Qwen3-Coder-480B-A35B-Instruct	Input: $0,22 / juta token Output: $1,80 / juta token Input Batch: $0,11 / juta token Output Batch: $0,90 / juta token
Qwen3-235B-A22B-Instruct-2507	Input: $0,22 / juta token Output: $0,88 / juta token Input Batch: $0,11 / juta token Output Batch: $0,44 / juta token

Model OpenAI

Model	Harga
gpt-oss-120b	Input: $0,09 / juta token Output: $0,36 / juta token Input Batch: $0,045 / juta token Output Batch: $0,18 / juta token
gpt-oss-20b	Input: $0,07 / juta token Output: $0,25 / juta token Input Batch: $0,035 / juta token Output Batch: $0,125 / juta token

Model Llama dari Meta

Model	Harga
Llama 3.1 405B	Input: $5,00 / juta token Output: $16,00 / juta token
Llama 3.3 70B	Input: $0,72 / juta token Output: $0,72 / juta token Input Batch: $0,36 / juta token Output Batch: $0,36 / juta token
Llama 4 Scout	Input: $0,25 / juta token Output: $0,70 / juta token Input Batch: $0,125 / juta token Output Batch: $0,35 / juta token
Llama 4 Maverick	Input: $0,35 / juta token Output: $1,15 / juta token Input Batch: $0,175 / juta token Output Batch: $0,575 / juta token

Model Mistral AI

Model	Harga
Mistral OCR (25.05)	Input: $0,0005 / juta token (atau $0,0005/halaman) Output: $0,0005 / juta token (atau $0,0005/halaman)
Mistral Medium 3	Input: $0,40 / juta token Output: $2,00 / juta token
Mistral Small 3.1 (25.03)	Input: $0,10 / juta token Output: $0,30 / juta token
Mistral Large (24.11) (tidak digunakan lagi)	Input: $2,00 / juta token Output: $6,00 / juta token
Codestral 2	Input: $0,30 / juta token Output: $0,90 / juta token
Codestral (25.01) (tidak digunakan lagi)	Input: $0,30 / juta token Output: $0,90 / juta token

Meminta penawaran harga khusus

Dengan model harga bayar sesuai penggunaan Google Cloud, Anda hanya membayar untuk layanan yang Anda gunakan. Hubungi tim penjualan kami untuk mendapatkan penawaran harga khusus bagi organisasi Anda.

Hubungi bagian penjualan