Mulai 29 April 2025, model Gemini 1.5 Pro dan Gemini 1.5 Flash tidak tersedia di project yang belum pernah menggunakan model ini, termasuk project baru. Untuk mengetahui detailnya, lihat Versi dan siklus proses model.

Halaman ini diterjemahkan oleh Cloud Translation API.

Memigrasikan aplikasi Anda ke Gemini 2 dengan Gemini API di Vertex AI

Panduan ini menunjukkan cara memigrasikan aplikasi AI generatif dari model Gemini 1.x dan PaLM ke model Gemini 2.

Mengapa harus bermigrasi ke Gemini 2?

Gemini 2 memberikan peningkatan performa yang signifikan dibandingkan model Gemini 1.x dan PaLM, serta kemampuan baru. Selain itu, setiap versi model memiliki linimasa dukungan dan ketersediaan versi-nya sendiri.

Mengupgrade sebagian besar aplikasi AI generatif ke Gemini 2 tidak memerlukan rekayasa ulang perintah atau kode yang signifikan. Namun, beberapa aplikasi memerlukan perubahan perintah, dan perubahan ini sulit diprediksi tanpa menjalankan perintah melalui Gemini 2 terlebih dahulu. Oleh karena itu, pengujian Gemini 2 direkomendasikan sebelum migrasi.

Perubahan kode yang signifikan hanya diperlukan untuk perubahan yang menyebabkan error tertentu, atau untuk menggunakan kemampuan Gemini 2 yang baru.

Model Gemini 2 mana yang harus saya migrasikan?

Saat memilih model Gemini 2 yang akan dimigrasikan, sebaiknya pertimbangkan fitur yang diperlukan aplikasi Anda, serta biaya fitur tersebut.

Untuk mengetahui ringkasan fitur model Gemini 2, lihat Gemini 2. Untuk ringkasan semua model Google, lihat model Google.

Untuk perbandingan model Gemini yang tersedia, lihat tabel berikut.

Fitur	Gemini 1.5 Pro	Gemini 1.5 Flash	Gemini 2.0 Flash	Gemini 2.0 Flash-Lite	Gemini 2.5 Pro	Gemini 2.5 Flash
Modalitas input	teks, dokumen, gambar, video, audio	teks, dokumen, gambar, video, audio	teks, dokumen, gambar, video, audio	teks, dokumen, gambar, video, audio	teks, dokumen, gambar, video, audio	teks, dokumen, gambar, video, audio
Modalitas output	teks biasa	teks biasa	teks biasa	teks biasa	teks biasa	teks biasa
Jendela konteks, batas total token	2.097.152	1.048.576	1.048.576	1.048.576	1.048.576	1.048.576
Panjang konteks output	8.192	8.192	8.192	8.192	64.192	64.192
Melakukan grounding dengan Penelusuran	Ya	Ya	Ya	Tidak	Ya	Ya
Pemanggilan fungsi	Ya	Ya	Ya	Ya	Ya	Ya
Eksekusi kode	Tidak	Tidak	Ya	Tidak	Ya	Ya
Menyimpan cache ke konteks	Ya	Ya	Ya	Tidak	Ya	Ya
Prediksi batch	Ya	Ya	Ya	Ya	Ya	Ya
Live API	Tidak	Tidak	Tidak	Tidak	Tidak	Tidak
Latensi	Paling canggih dalam keluarga 1.5	Tercepat dalam keluarga 1.5	Cepat + efisiensi biaya yang baik	Cepat + paling hemat biaya	Lebih lambat daripada Flash, tetapi efisiensi biayanya baik	Cepat + paling hemat biaya
Penyesuaian	Ya	Ya	Ya	Ya	Ya	Ya
SDK yang direkomendasikan	Vertex AI SDK	Vertex AI SDK	Gen AI SDK	Gen AI SDK	Gen AI SDK	Gen AI SDK
Unit harga	Berbasis karakter	Berbasis karakter	Token	Token	Token	Token

Ringkasan proses migrasi

Dokumen ini menguraikan proses delapan langkah untuk memigrasikan aplikasi Anda ke Gemini 2. Gunakan diagram berikut untuk membuka setiap langkah.

Proses

Sebelum memulai

Langkah 1: Selesaikan prasyarat

Untuk migrasi Gemini 2 yang lancar, sebaiknya Anda mengatasi masalah berikut sebelum memulai proses migrasi.

Ketersediaan model: Perhatikan linimasa ketersediaan dan dukungan versi model untuk model Gemini lama, dan pastikan migrasi Anda selesai sebelum model yang Anda gunakan dihentikan.
InfoSec, tata kelola, dan persetujuan peraturan: Minta persetujuan yang Anda perlukan untuk Gemini 2 secara proaktif dari pemangku kepentingan keamanan informasi (InfoSec), risiko, dan kepatuhan. Pastikan Anda mencakup batasan kepatuhan dan risiko khusus domain, terutama di industri yang diatur dengan ketat seperti layanan kesehatan dan jasa keuangan. Perhatikan bahwa kontrol keamanan Gemini berbeda di antara model Gemini 2.
Ketersediaan lokasi: Lihat dokumentasi Ketersediaan model AI Generatif di model Google Cloud dan model partner, dan pastikan model Gemini 2 yang Anda pilih tersedia di region tempat Anda membutuhkannya, atau pertimbangkan untuk beralih ke endpoint global.
Perbedaan harga berdasarkan modalitas dan tokenisasi: Periksa harga Gemini 2 untuk semua modalitas (teks, kode, gambar, ucapan) di aplikasi Anda. Untuk mengetahui informasi selengkapnya, lihat halaman harga AI generatif. Perhatikan bahwa input dan output teks Gemini 2 diberi harga per token, sedangkan input dan output teks Gemini 1 diberi harga per karakter.
Throughput yang Disediakan: Jika diperlukan, beli Throughput yang Disediakan tambahan untuk Gemini 2 atau ubah pesanan Throughput yang Disediakan yang ada.
Penyesuaian yang diawasi: Jika aplikasi Gemini Anda menggunakan penyesuaian yang diawasi, kirim tugas penyesuaian baru dengan Gemini 2. Sebaiknya mulai dengan hyperparameter penyesuaian default, bukan menggunakan kembali nilai hyperparameter yang Anda gunakan dengan versi Gemini sebelumnya. Layanan penyesuaian telah dioptimalkan untuk Gemini 2. Oleh karena itu, menggunakan kembali nilai hyperparameter sebelumnya mungkin tidak memberikan hasil terbaik.
Pengujian regresi: Ada tiga jenis utama pengujian regresi yang terlibat saat mengupgrade ke model Gemini 2:
- Pengujian regresi kode: Pengujian regresi dari perspektif DevOps dan software engineering. Jenis pengujian regresi ini selalu diperlukan.
- Pengujian regresi performa model: Pengujian regresi dari perspektif data science atau machine learning. Hal ini berarti memastikan bahwa model Gemini 2 baru memberikan output yang setidaknya sama berkualitasnya dengan output dari model produksi saat ini. Pengujian regresi performa model hanyalah evaluasi model yang dilakukan sebagai bagian dari perubahan pada sistem atau model yang mendasarinya. Pengujian regresi performa model selanjutnya dibagi menjadi:
  - Pengujian performa model offline: Menilai kualitas output model di lingkungan eksperimen khusus berdasarkan berbagai metrik kualitas output model.
  - Pengujian performa model online: Menilai kualitas output model dalam deployment online langsung berdasarkan masukan pengguna implisit atau eksplisit.
- Pengujian beban: Menilai cara aplikasi menangani volume permintaan inferensi yang tinggi. Jenis pengujian regresi ini diperlukan untuk aplikasi yang memerlukan Provisioned Throughput.

Mendokumentasikan persyaratan pengujian dan evaluasi model

Langkah 2: Mendokumentasikan persyaratan evaluasi dan pengujian

Bersiaplah untuk mengulangi evaluasi yang relevan sejak Anda awalnya mem-build aplikasi, beserta evaluasi relevan yang telah Anda lakukan sejak saat itu.
Jika merasa evaluasi yang ada tidak mencakup atau mengukur cakupan tugas yang dilakukan aplikasi dengan tepat, Anda harus mendesain dan menyiapkan evaluasi tambahan.
Jika aplikasi Anda melibatkan RAG, penggunaan alat, alur kerja agen yang kompleks, atau rantai perintah, pastikan data evaluasi yang ada memungkinkan Anda menilai setiap komponen secara independen. Jika tidak, kumpulkan contoh input-output untuk setiap komponen.
Jika aplikasi Anda memiliki dampak yang sangat tinggi, atau jika merupakan bagian dari sistem real-time yang lebih besar yang ditampilkan kepada pengguna, Anda harus menyertakan evaluasi online.

Upgrade dan pengujian kode

Langkah 3: Upgrade dan uji kode

Jika aplikasi Gemini 1.x Anda menggunakan Vertex AI SDK, pertimbangkan untuk mengupgrade ke Gen AI SDK. Kemampuan Gemini 2 baru hanya tersedia di Gen AI SDK. Namun, Anda tidak perlu beralih ke Gen AI SDK jika aplikasi Anda hanya memerlukan kemampuan yang tersedia di Vertex AI SDK.

Fitur / Aspek	Gen AI SDK	Vertex AI SDK
Fokus Utama	Dioptimalkan untuk model Gemini dan fitur AI generatif baru.	Platform Vertex AI yang lebih luas, termasuk alur kerja ML konvensional.
Dukungan Fitur Gemini 2	Dukungan penuh untuk semua kemampuan Gemini 2 baru.	Dukungan terbatas; fitur baru tidak ditambahkan.
Rekomendasi	Direkomendasikan untuk aplikasi baru atau saat menggunakan fitur lanjutan Gemini 2.	Cocok jika aplikasi Anda hanya menggunakan fitur yang sama untuk kedua SDK dan sudah terintegrasi.

Jika Anda baru menggunakan Gen AI SDK, lihat notebook Memulai AI Generatif Google menggunakan Gen AI SDK.

Gen AI SDK

Sebaiknya Anda bermigrasi ke Gen AI SDK saat mengupgrade ke Gemini 2.0. Jika Anda memilih untuk menggunakan Gen AI SDK, proses penyiapannya berbeda dengan Vertex AI SDK. Untuk informasi selengkapnya, buka Google Gen AI SDK.

Instal

pip install --upgrade google-genai

Untuk mempelajari lebih lanjut, lihat dokumentasi referensi SDK.

Menetapkan variabel lingkungan

Tetapkan variabel lingkungan untuk menggunakan Gen AI SDK dengan Vertex AI:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True

from google import genai
from google.genai.types import HttpOptions

client = genai.Client(http_options=HttpOptions(api_version="v1"))
response = client.models.generate_content(
model="gemini-2.5-flash",
contents="How does AI work?",
)
print(response.text)

# Example response:
# Okay, let's break down how AI works. It's a broad field, so I'll focus on the ...
# Here's a simplified overview:
# ...

Ganti GOOGLE_CLOUD_PROJECT dengan project ID Google Cloud Anda, dan ganti GOOGLE_CLOUD_LOCATION dengan lokasi project Google Cloud Anda (misalnya, us-central1).

Vertex AI SDK

Jika Anda menggunakan kembali Vertex AI SDK, proses penyiapannya sama untuk model 1.0, 1.5, dan 2.0. Untuk mengetahui informasi selengkapnya, lihat Pengantar Vertex AI SDK untuk Python.

Menginstal SDK

 pip install --upgrade --quiet google-cloud-aiplatform

Berikut adalah contoh kode singkat yang menggunakan Vertex AI SDK untuk Python:

 
import vertexai
from vertexai.generative_models import GenerativeModel

# TODO(developer): Update and un-comment below line
# PROJECT_ID = "your-project-id"
vertexai.init(project=PROJECT_ID, location="us-central1")

model = GenerativeModel("gemini-2.0-flash-001")

response = model.generate_content(
    "What's a good name for a flower shop that specializes in selling bouquets of dried flowers?"
)

print(response.text)
# Example response:
# **Emphasizing the Dried Aspect:**
# * Everlasting Blooms
# * Dried & Delightful
# * The Petal Preserve
# ...

Ganti PROJECT_ID dengan project ID Google Cloud Anda, dan ganti LOCATION dengan lokasi project Google Cloud Anda (misalnya, us-central1). Kemudian, ubah ID model dari gemini-1.5-flash-002 menjadi gemini-2.0-flash.

Mengubah panggilan Gemini Anda

Ubah kode prediksi Anda untuk menggunakan Gemini 2. Setidaknya, ini berarti mengubah nama endpoint model tertentu menjadi model Gemini 2 tempat Anda memuat model.

Perubahan kode yang sebenarnya akan berbeda, bergantung pada cara Anda menerapkan aplikasi pada awalnya, dan terutama apakah Anda menggunakan Gen AI SDK atau Vertex AI SDK.

Setelah Anda melakukan perubahan kode, lakukan pengujian regresi kode dan pengujian software lainnya pada kode Anda untuk memastikannya berjalan. Pengujian ini hanya dimaksudkan untuk menilai apakah kode berfungsi dengan benar. Laporan ini tidak dimaksudkan untuk menilai kualitas respons model.

Mengatasi perubahan kode yang menyebabkan gangguan

Pengambilan dinamis: Beralihlah untuk menggunakan Pemahaman dengan Google Penelusuran. Fitur ini memerlukan penggunaan Gen AI SDK; fitur ini tidak didukung oleh Vertex AI SDK.
Filter konten: Perhatikan setelan filter konten default, dan ubah kode Anda jika kode tersebut bergantung pada setelan default yang telah berubah.
Parameter sampling token Top-K: Model setelah gemini-1.0-pro-vision tidak mendukung perubahan parameter Top-K.

Hanya berfokuslah pada perubahan kode dalam langkah ini. Anda mungkin perlu melakukan perubahan lain, tetapi tunggu hingga Anda memulai evaluasi, lalu pertimbangkan penyesuaian berikut berdasarkan hasil evaluasi:

Jika beralih dari pengambilan dinamis, Anda mungkin perlu bereksperimen dengan petunjuk sistem untuk mengontrol kapan Google Penelusuran digunakan (misalnya, "Only generate queries for the Google Search tool if the user asks about sports. Don't generate queries for any other topic."), tetapi tunggu hingga Anda mengevaluasi sebelum membuat perubahan perintah.
Jika Anda menggunakan parameter Top-K, sesuaikan parameter sampling token lainnya, seperti Top-P, untuk mendapatkan hasil yang serupa.

Evaluasi offline

Langkah 4: Lakukan evaluasi offline

Ulangi evaluasi yang Anda lakukan saat pertama kali mengembangkan dan meluncurkan aplikasi, evaluasi offline lebih lanjut yang Anda lakukan setelah peluncuran, dan evaluasi tambahan yang Anda identifikasi di langkah 1. Jika Anda merasa bahwa evaluasi Anda tidak sepenuhnya menangkap cakupan dan kedalaman aplikasi Anda, lakukan evaluasi lebih lanjut.

Jika Anda tidak memiliki cara otomatis untuk menjalankan evaluasi offline, pertimbangkan untuk menggunakan layanan evaluasi AI generatif.

Jika aplikasi Anda menggunakan penyesuaian halus, lakukan evaluasi offline sebelum menyesuaikan ulang model dengan Gemini 2. Kualitas output Gemini 2 yang ditingkatkan mungkin berarti bahwa aplikasi Anda tidak lagi memerlukan model yang disesuaikan.

Menilai hasil evaluasi dan menyesuaikan perintah serta hyperparameter Gemini 2

Langkah 5: Evaluasi hasil dan sesuaikan perintah

Jika evaluasi offline Anda menunjukkan penurunan performa dengan Gemini 2, lakukan iterasi pada aplikasi Anda sebagai berikut hingga performa Gemini cocok dengan model lama:

Buat rekayasa perintah secara berulang untuk meningkatkan performa ("Hill Climbing"). Jika Anda baru mengenal hill climbing, lihat pelatihan online hill climbing Vertex Gemini. Pengoptimal perintah Vertex AI (contoh notebook) juga dapat membantu.
Jika aplikasi Anda sudah mengandalkan penyesuaian, coba sesuaikan Gemini 2.
Jika aplikasi Anda terpengaruh oleh perubahan yang menyebabkan gangguan pada Pengambilan Dinamis dan Top-K, bereksperimenlah dengan mengubah parameter pengambilan perintah dan sampling token.

Pengujian beban

Langkah 6: Lakukan pengujian beban

Jika aplikasi Anda memerlukan throughput minimum tertentu, lakukan pengujian beban untuk memastikan aplikasi versi Gemini 2 memenuhi persyaratan throughput Anda.

Pengujian beban harus dilakukan sebelum evaluasi online, karena evaluasi online memerlukan eksposur Gemini 2 ke traffic produksi. Gunakan instrumentasi pengujian beban yang ada untuk melakukan langkah ini.

Jika aplikasi Anda sudah memenuhi persyaratan throughput, pertimbangkan untuk menggunakan Provisioned Throughput. Anda memerlukan Provisioned Throughput jangka pendek tambahan untuk menampung pengujian beban saat pesanan Provisioned Throughput yang ada terus menyalurkan traffic produksi.

Evaluasi online

Langkah 7: Lakukan evaluasi online

Hanya lanjutkan ke evaluasi online jika evaluasi offline Anda menunjukkan kualitas output Gemini yang memadai dan aplikasi Anda memerlukan evaluasi online.

Evaluasi online adalah kasus khusus dari pengujian online. Coba gunakan alat dan prosedur yang ada di organisasi Anda untuk evaluasi online. Contoh:

Jika organisasi Anda secara rutin melakukan pengujian A/B, lakukan pengujian A/B yang mengevaluasi penerapan aplikasi Anda saat ini dibandingkan dengan versi Gemini 2.
Jika organisasi Anda secara rutin melakukan penerapan canary, pastikan untuk melakukannya dengan Gemini 2 dan mengukur perbedaan perilaku pengguna.

Evaluasi online juga dapat dilakukan dengan membuat kemampuan pengukuran dan masukan baru ke dalam aplikasi Anda. Kemampuan pengukuran dan masukan yang berbeda sesuai untuk aplikasi yang berbeda. Contoh:

Menambahkan tombol suka dan tidak suka di samping output model dan membandingkan rasio suka versus tidak suka antara model lama dan Gemini 2.
Menampilkan output model lama dan Gemini 2 secara berdampingan kepada pengguna dan meminta pengguna untuk memilih favorit mereka.
Melacak seberapa sering pengguna mengganti atau menyesuaikan output model lama secara manual dibandingkan dengan Gemini 2.

Jenis mekanisme masukan ini sering kali memerlukan pengoperasian aplikasi versi Gemini 2 secara paralel dengan versi yang ada. Deployment paralel ini terkadang disebut "mode bayangan" atau "deployment blue-green".

Jika hasil evaluasi online berbeda secara signifikan dengan hasil evaluasi offline, evaluasi offline Anda tidak menangkap aspek utama dari lingkungan aktif atau pengalaman pengguna. Gunakan temuan evaluasi online untuk menyusun evaluasi offline baru guna menutup kesenjangan yang terungkap dalam evaluasi online, lalu kembali ke langkah 3.

Jika menggunakan Provisioned Throughput, Anda mungkin perlu membeli Provisioned Throughput jangka pendek tambahan untuk terus memenuhi persyaratan throughput bagi pengguna yang tunduk pada evaluasi online.

Deployment produksi

Langkah 8: Men-deploy ke produksi

Setelah evaluasi menunjukkan bahwa Gemini 2 memenuhi atau melebihi performa model lama, nonaktifkan versi aplikasi yang ada dan gunakan versi Gemini 2. Ikuti prosedur yang ada di organisasi Anda untuk peluncuran produksi.

Jika Anda menggunakan Provisioned Throughput, ubah pesanan Provisioned Throughput ke model Gemini 2 yang Anda pilih. Jika Anda meluncurkan aplikasi secara bertahap, gunakan Provisioned Throughput jangka pendek untuk memenuhi persyaratan throughput untuk dua model Gemini yang berbeda.

Meningkatkan performa model

Saat Anda menyelesaikan migrasi, gunakan tips berikut untuk memaksimalkan performa model Gemini 2:

Periksa petunjuk sistem, perintah, dan contoh pembelajaran few-shot untuk menemukan inkonsistensi, kontradiksi, atau petunjuk dan contoh yang tidak relevan.
Menguji model yang lebih canggih. Misalnya, jika Anda mengevaluasi Gemini 2.0 Flash-Lite, coba Gemini 2.0 Flash.
Periksa hasil evaluasi otomatis untuk memastikan hasil tersebut cocok dengan penilaian manusia, terutama hasil yang menggunakan model hakim. Pastikan petunjuk model juri Anda tidak berisi inkonsistensi atau ambiguitas.
Salah satu cara untuk meningkatkan kualitas petunjuk model hakim adalah dengan menguji petunjuk tersebut dengan beberapa orang secara terpisah dan melihat apakah penilaian mereka konsisten. Jika manusia menafsirkan petunjuk secara berbeda dan memberikan penilaian yang berbeda, petunjuk model hakim Anda ambigu.
Menyesuaikan model Gemini 2.
Periksa output evaluasi untuk mencari pola yang menunjukkan jenis kegagalan tertentu. Mengelompokkan kegagalan ke dalam berbagai model, jenis, atau kategori akan memberi Anda data evaluasi yang lebih ditargetkan, sehingga memudahkan penyesuaian perintah untuk mengatasi error ini.
Pastikan Anda mengevaluasi berbagai komponen AI generatif secara independen.
Bereksperimenlah dengan menyesuaikan parameter sampling token.

Mendapatkan bantuan

Jika Anda memerlukan bantuan, Google Cloud menawarkan paket dukungan untuk memenuhi kebutuhan Anda, seperti cakupan 24/7, dukungan telepon, dan akses ke pengelola dukungan teknis. Untuk informasi selengkapnya, lihat Dukungan Google Cloud.

Langkah berikutnya

Baca daftar pertanyaan umum.
Bermigrasi dari PaLM API ke Gemini API di Vertex AI.