Halaman ini diterjemahkan oleh Cloud Translation API.

Model Google

Model Gemini unggulan

2.5 Pro

Model Gemini kami dengan kemampuan penalaran paling canggih, dibuat untuk menyelesaikan masalah kompleks

Terbaik untuk pemahaman multimodal
Mampu memproses perintah yang kompleks dan memberikan respons yang menyeluruh
Terbaik untuk coding, terutama untuk pengembangan web

2.5 Flash

Model terbaik kami dalam hal performa harga, yang menawarkan kemampuan serbaguna

Dukungan untuk Live API disertakan untuk beberapa endpoint
Melihat proses berpikir model sebagai bagian dari respons
Menyeimbangkan harga dan performa

2.5 Flash-Lite

Model kami yang paling hemat biaya dan mendukung tugas dengan throughput tinggi

Model tercepat dalam rangkaian model 2.5
Menampilkan jendela konteks 1 juta token dan input multimodal, seperti 2.5 Flash
Mengungguli 2.0 Flash pada sebagian besar tolok ukur evaluasi

Model Gemini yang tersedia secara umum

diamond Gemini 2.5 Pro Model penalaran tercanggih kami hingga saat ini

spark Gemini 2.5 Flash Model terbaik kami dalam hal performa harga, yang menawarkan kemampuan serbaguna

performance_auto Gemini 2.5 Flash-Lite Model kami yang paling hemat biaya yang mendukung tugas dengan throughput tinggi

spark Gemini 2.0 Flash Model multimodal terbaru kami, dengan fitur generasi berikutnya dan kemampuan yang ditingkatkan

performance_auto Gemini 2.0 Flash-Lite Model Gemini 2.0 Flash yang dioptimalkan untuk efisiensi biaya dan latensi rendah

Melihat pratinjau model Gemini

photo_spark Pratinjau Gambar Gemini 2.5 Flash Model standar kami yang ditingkatkan untuk alur kerja kreatif yang cepat dengan kemampuan pembuatan gambar dan pengeditan multi-turn percakapan. produk AI yang paling jelas.

Model Gemma

Gemma 3n Model terbuka terbaru, yang didesain untuk eksekusi yang efisien di perangkat dengan sumber daya rendah, mampu menerima input multimodal, menangani input teks, gambar, video, dan audio, serta menghasilkan output teks, dan dilatih dengan data dalam lebih dari 140 bahasa lisan

Gemma 3 Model terbuka generasi ketiga kami, yang memiliki kemampuan untuk menyelesaikan berbagai tugas dengan input teks dan gambar, dukungan untuk lebih dari 140 bahasa, dan jendela konteks 128K yang panjang

Gemma 2 Model terbuka generasi kedua kami yang memiliki kemampuan pembuatan, peringkasan, dan ekstraksi teks

Gemma Model terbuka berukuran kecil dan ringan yang mendukung pembuatan, peringkasan, dan ekstraksi teks

ShieldGemma 2 Model yang disesuaikan untuk petunjuk dalam mengevaluasi keamanan teks dan gambar berdasarkan serangkaian kebijakan keamanan yang telah ditentukan

PaliGemma Model bahasa-penglihatan terbuka kami yang menggabungkan SigLIP dan Gemma

CodeGemma Model terbuka yang canggih dan ringan yang dapat melakukan berbagai tugas coding seperti penyelesaian kode di tengah, pembuatan kode, pemahaman bahasa alami, penalaran matematika, dan mengikuti petunjuk

TxGemma Menghasilkan prediksi, klasifikasi, atau teks berdasarkan data terkait terapi dan dapat digunakan untuk membangun model AI secara efisien untuk tugas terkait terapi dengan lebih sedikit data dan lebih sedikit komputasi

MedGemma Kumpulan varian Gemma 3 yang dilatih untuk performa pada pemahaman teks dan gambar medis

MedSigLIP Varian SigLIP yang dilatih untuk mengenkode gambar dan teks medis ke dalam ruang penyematan umum

T5Gemma Serangkaian model riset encoder-decoder yang ringan namun canggih dari Google

Model embedding

width_normal Embedding untuk Teks Mengonversi data teks menjadi representasi vektor untuk penelusuran semantik, klasifikasi, pengelompokan, dan tugas serupa

width_normal Embedding Multimodal Membuat vektor berdasarkan gambar, yang dapat digunakan untuk tugas hilir seperti klasifikasi gambar, penelusuran gambar, dan lainnya

Model Imagen yang tersedia secara umum

photo_spark Imagen 4 for Generation Gunakan perintah teks untuk membuat gambar baru dengan kualitas yang lebih tinggi daripada model pembuatan gambar kami sebelumnya

photo_spark Imagen 4 for Fast Generation Gunakan perintah teks untuk membuat gambar baru dengan kualitas yang lebih tinggi dan latensi yang lebih rendah daripada model pembuatan gambar kami sebelumnya

photo_spark Imagen 4 for Ultra Generation Gunakan perintah teks untuk membuat gambar baru dengan kualitas yang lebih tinggi dan kepatuhan perintah yang lebih baik daripada model pembuatan gambar kami sebelumnya

photo_spark Imagen 3 for Generation Gunakan perintah teks untuk membuat gambar baru

image_edit_auto Imagen 3 for Editing and Customization Gunakan perintah teks untuk mengedit gambar input yang ada, atau bagian gambar dengan mask, atau membuat gambar baru berdasarkan konteks yang diberikan oleh gambar referensi input

photo_spark Imagen 3 for Fast Generation Gunakan perintah teks untuk membuat gambar baru dengan latensi yang lebih rendah daripada model pembuatan gambar kami yang lain

subtitles Imagen for Captioning & VQA Gunakan perintah teks untuk membuat gambar baru, mengedit gambar yang ada, mengedit bagian gambar dengan mask, dan lainnya

Melihat pratinjau model Imagen

photo_spark Coba Virtual Buat gambar orang yang mengenakan produk pakaian.

image_edit_auto Produk Imagen merekontekstualisasi di Vertex AI Gunakan perintah teks untuk mengedit gambar produk ke dalam berbagai adegan atau latar belakang.

Model Veo

film Veo 2 Gunakan perintah teks dan gambar untuk membuat video baru

film Veo 3 Gunakan perintah teks dan gambar untuk membuat video baru dengan kualitas yang lebih tinggi daripada model pembuatan video kami sebelumnya

film Veo 3 Fast Gunakan perintah teks dan gambar untuk membuat video baru dengan kualitas yang lebih tinggi dan latensi yang lebih rendah daripada model pembuatan video kami sebelumnya

Melihat pratinjau model Veo

film Pratinjau Veo 3 Gunakan perintah teks dan gambar untuk membuat video baru dengan kualitas yang lebih tinggi daripada model pembuatan video kami sebelumnya

film Pratinjau Veo 3 Fast Gunakan perintah teks dan gambar untuk membuat video baru dengan kualitas yang lebih tinggi dan latensi yang lebih rendah daripada model pembuatan video kami sebelumnya

Model Veo eksperimental

film Veo 2 Eksperimental Model eksperimental, dengan fitur yang sedang diuji.

Model MedLM

medical_information MedLM-medium Serangkaian model yang disesuaikan secara medis dan mematuhi HIPAA yang dirancang untuk membantu praktisi kesehatan dalam tugas tanya jawab medis, dan tugas meringkas dokumen kesehatan dan medis

clinical_notes MedLM-large-large Serangkaian model yang disesuaikan secara medis dan mematuhi HIPAA yang dirancang untuk membantu praktisi kesehatan dalam tugas tanya jawab medis, dan tugas meringkas dokumen kesehatan dan medis

Dukungan bahasa

Gemini

Semua model Gemini dapat memahami dan merespons dalam bahasa berikut:

Afrikaans (af), Albania (sq), Amharik (am), Arab (ar), Armenia (hy), Assam (as), Azerbaijan (az), Basque (eu), Belarusia (be), Bengali (bn), Bosnia (bs), Bulgaria (bg), Katalan (ca), Cebuano (ceb), China (Sederhana dan Tradisional) (zh), Korsika (co), Kroasia (hr), Ceko (cs), Denmark (da), Dhivehi (dv), Belanda (nl), Inggris (en), Esperanto (eo), Estonia (et), Filipina (Tagalog) (fil), Finlandia (fi), Prancis (fr), Frisia (fy), Galicia (gl), Georgia (ka), Jerman (de), Yunani (el), Gujarati (gu), Haiti (ht), Hausa (ha), Hawaii (haw), Ibrani (iw), Hindi (hi), Hmong (hmn), Hungaria (hu), Islandia (is), Igbo (ig), Indonesia (id), Irlandia (ga), Italia (it), Jepang (ja), Jawa (jv), Kannada (kn), Kazakh (kk), Khmer (km), Korea (ko), Krio (kri), Kurdi (ku), Kirgizstan (ky), Lao (lo), Latin (la), Latvia (lv), Lituania (lt), Luksemburg (lb), Makedonia (mk), Malagasi (mg), Melayu (ms), Malayalam (ml), Malta (mt), Maori (mi), Marathi (mr), Meiteilon (Manipuri) (mni-Mtei), Mongolia (mn), Myanmar (Burma) (my), Nepal (ne), Norwegia (no), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Pashto (ps), Persia (fa), Polandia (pl), Portugis (pt), Punjabi (pa), Romania (zh), Rusia (ru), Samoa (sm), Gaelik Skotlandia (gd), Serbia (sr), Sesotho (st), Shona (sn), Sindhi (sd), Sinhala (Sinhala) (si), Slovakia (sk), Slovenia (sl), Somalia (so), Spanyol (es), Sunda (su), Swahili (sw), Swedia (sv), Tajikistan (tg), Tamil (ta), Telugu (te), Thai (th), Turkiye (tr), Ukraina (uk), Urdu (ur), Uighur (ug), Uzbekistan (uz), Vietnam (vi), Wales (cy), Xhosa (xh), Yiddish (yi), Yoruba (yo), dan Zulu (zu).ro

Gemma

Gemma dan Gemma 2 hanya mendukung bahasa Inggris (en). Gemma 3 dan Gemma 3n memberikan dukungan multibahasa dalam lebih dari 140 bahasa.

Embedding

Model embedding teks multibahasa mendukung bahasa berikut:

Afrikaans (af), Albania (sq), Amharik (am), Arab (ar), Armenia (hy), Azerbaijan (az), Basque (eu), Belarusia (be), Bengali (bn), Bulgaria (bg), Catalan (ca), Cebuano (ceb), China (Sederhana dan Tradisional) (zh), Korsika (co), Ceko (cs), Denmark (da), Belanda (nl), Inggris (en), Esperanto (eo), Estonia (et), Filipina (Tagalog) (fil), Finlandia (fi), Prancis (fr), Frisia (fy), Galicia (gl), Georgia (ka), Jerman (de), Yunani (el), Gujarat (gu), Kreyol Haiti (ht), Hausa (ha), Hawaii (haw), Ibrani (iw), Hindi (hi), Hmong (hmn), Hungaria (hu), Islandia (is), Igbo (ig), Indonesia (id), Irlandia (ga), Italia (it), Jepang (ja), Jawa (jv), Kannada (kn), Kazakh (kk), Khmer (km), Korea (ko), Kurdi (ku), Kirgiz (ky), Lao (lo), Latin (la), Latvia (lv), Lituania (lt), Luksemburg (lb), Makedonia (mk), Malagasi (mg), Melayu (ms), Malayalam (ml), Malta (mt), Maori (mi), Marathi (mr), Mongolia (mn), Myanmar (Burma) (my), Nepal (ne), Nyanja (Chichewa) (ny), Norwegia (no), Pashto (ps), Persia (fa), Polandia (pl), Portugis (pt), Punjabi (pa), Romania (ro), Rusia (ru), Samoa (sm), Gaelik Skotlandia (gd), Serbia (sr), Sesotho (st), Shona (sn), Sindhi (sd), Sinhala (Sinhala) (si), Slovakia (sk), Slovenia (sl), Somalia (so), Spanyol (es), Sunda (su), Swahili (sw), Swedia (sv), Tajik (tg), Tamil (ta), Telugu (te), Thai (th), Turkiye (tr), Ukraina (uk), Urdu (ur), Uzbekistan (uz), Vietnam (vi), Wales (cy), Xhosa (xh), Yiddish (yi), Yoruba (yo), dan Zulu (zu).

Imagen 3

Imagen 3 mendukung bahasa berikut:

Inggris (en), China (Aksara Sederhana dan Tradisional) (zh), Hindi (hi), Jepang (ja), Korea (ko), Portugis (pt), dan Spanyol (es).

MedLM

Model MedLM mendukung bahasa Inggris (en).

Mempelajari semua model di Model Garden

Model Garden adalah platform yang membantu Anda menemukan, menguji, menyesuaikan, dan men-deploy model & aset OSS tertentu serta eksklusif Google. Untuk mempelajari model dan API AI generatif yang tersedia di Vertex AI, buka Model Garden di konsol Google Cloud .

Buka Model Garden

Untuk mempelajari lebih lanjut Model Garden, termasuk model dan kemampuan yang tersedia, lihat Mempelajari model AI di Model Garden.

Versi model

Untuk melihat semua versi model, termasuk model lama dan yang tidak digunakan lagi, lihat Versi dan siklus proses model.

Langkah berikutnya

Coba tutorial panduan memulai menggunakan Vertex AI Studio atau Vertex AI API.
Pelajari model terlatih di Model Garden.
Pelajari cara mengontrol akses ke model tertentu di Model Garden dengan menggunakan kebijakan organisasi Model Garden.
Pelajari harga