Memigrasikan aplikasi Anda ke Gemini 2 dengan Gemini API di Vertex AI

Panduan ini menunjukkan cara memigrasikan aplikasi AI generatif dari model Gemini 1.x dan PaLM ke model Gemini 2.

Mengapa harus bermigrasi ke Gemini 2?

Gemini 2 memberikan peningkatan performa yang signifikan dibandingkan model Gemini 1.x dan PaLM, serta kemampuan baru. Selain itu, setiap versi model memiliki linimasa dukungan dan ketersediaan versi-nya sendiri.

Mengupgrade sebagian besar aplikasi AI generatif ke Gemini 2 tidak memerlukan rekayasa ulang perintah atau kode yang signifikan. Namun, beberapa aplikasi memerlukan perubahan perintah, dan perubahan ini sulit diprediksi tanpa menjalankan perintah melalui Gemini 2 terlebih dahulu. Oleh karena itu, pengujian Gemini 2 direkomendasikan sebelum migrasi.

Perubahan kode yang signifikan hanya diperlukan untuk perubahan yang menyebabkan error tertentu, atau untuk menggunakan kemampuan Gemini 2 yang baru.

Model Gemini 2 mana yang harus saya migrasikan?

Saat memilih model Gemini 2 yang akan dimigrasikan, sebaiknya pertimbangkan fitur yang diperlukan aplikasi Anda, serta biaya fitur tersebut.

Untuk mengetahui ringkasan fitur model Gemini 2, lihat Gemini 2. Untuk ringkasan semua model Google, lihat model Google.

Untuk perbandingan model Gemini yang tersedia, lihat tabel berikut.

Fitur Gemini 1.5 Pro Gemini 1.5 Flash Gemini 2.0 Flash Gemini 2.0 Flash-Lite Gemini 2.5 Pro Gemini 2.5 Flash
Modalitas input teks, dokumen, gambar, video, audio teks, dokumen, gambar, video, audio teks, dokumen, gambar, video, audio teks, dokumen, gambar, video, audio teks, dokumen, gambar, video, audio teks, dokumen, gambar, video, audio
Modalitas output teks biasa teks biasa teks biasa teks biasa teks biasa teks biasa
Jendela konteks, batas total token 2.097.152 1.048.576 1.048.576 1.048.576 1.048.576 1.048.576
Panjang konteks output 8.192 8.192 8.192 8.192 64.192 64.192
Melakukan grounding dengan Penelusuran Ya Ya Ya Tidak Ya Ya
Pemanggilan fungsi Ya Ya Ya Ya Ya Ya
Eksekusi kode Tidak Tidak Ya Tidak Ya Ya
Menyimpan cache ke konteks Ya Ya Ya Tidak Ya Ya
Prediksi batch Ya Ya Ya Ya Ya Ya
Live API Tidak Tidak Tidak Tidak Tidak Tidak
Latensi Paling canggih dalam keluarga 1.5 Tercepat dalam keluarga 1.5 Cepat + efisiensi biaya yang baik Cepat + paling hemat biaya Lebih lambat daripada Flash, tetapi efisiensi biayanya baik Cepat + paling hemat biaya
Penyesuaian Ya Ya Ya Ya Ya Ya
SDK yang direkomendasikan Vertex AI SDK Vertex AI SDK Gen AI SDK Gen AI SDK Gen AI SDK Gen AI SDK
Unit harga Berbasis karakter Berbasis karakter Token Token Token Token

Ringkasan proses migrasi

Dokumen ini menguraikan proses delapan langkah untuk memigrasikan aplikasi Anda ke Gemini 2. Gunakan diagram berikut untuk membuka setiap langkah.

Proses

Sebelum memulai

Mendokumentasikan persyaratan pengujian dan evaluasi model

Upgrade dan pengujian kode

Evaluasi offline

Menilai hasil evaluasi dan menyesuaikan perintah serta hyperparameter Gemini 2

Pengujian beban

Evaluasi online

Deployment produksi

Meningkatkan performa model

Saat Anda menyelesaikan migrasi, gunakan tips berikut untuk memaksimalkan performa model Gemini 2:

  • Periksa petunjuk sistem, perintah, dan contoh pembelajaran few-shot untuk menemukan inkonsistensi, kontradiksi, atau petunjuk dan contoh yang tidak relevan.
  • Menguji model yang lebih canggih. Misalnya, jika Anda mengevaluasi Gemini 2.0 Flash-Lite, coba Gemini 2.0 Flash.
  • Periksa hasil evaluasi otomatis untuk memastikan hasil tersebut cocok dengan penilaian manusia, terutama hasil yang menggunakan model hakim. Pastikan petunjuk model juri Anda tidak berisi inkonsistensi atau ambiguitas.
  • Salah satu cara untuk meningkatkan kualitas petunjuk model hakim adalah dengan menguji petunjuk tersebut dengan beberapa orang secara terpisah dan melihat apakah penilaian mereka konsisten. Jika manusia menafsirkan petunjuk secara berbeda dan memberikan penilaian yang berbeda, petunjuk model hakim Anda ambigu.
  • Menyesuaikan model Gemini 2.
  • Periksa output evaluasi untuk mencari pola yang menunjukkan jenis kegagalan tertentu. Mengelompokkan kegagalan ke dalam berbagai model, jenis, atau kategori akan memberi Anda data evaluasi yang lebih ditargetkan, sehingga memudahkan penyesuaian perintah untuk mengatasi error ini.
  • Pastikan Anda mengevaluasi berbagai komponen AI generatif secara independen.
  • Bereksperimenlah dengan menyesuaikan parameter sampling token.

Mendapatkan bantuan

Jika Anda memerlukan bantuan, Google Cloud menawarkan paket dukungan untuk memenuhi kebutuhan Anda, seperti cakupan 24/7, dukungan telepon, dan akses ke pengelola dukungan teknis. Untuk informasi selengkapnya, lihat Dukungan Google Cloud.

Langkah berikutnya

  • Baca daftar pertanyaan umum.
  • Bermigrasi dari PaLM API ke Gemini API di Vertex AI.