Cloud SQL memungkinkan Anda mendapatkan prediksi online dalam
kode SQL dengan memanggil
fungsi ml_predict_row()
. Untuk informasi selengkapnya, lihat Mem-build aplikasi AI
generatif menggunakan Cloud SQL.
Sebelum memulai
Sebelum dapat memanggil prediksi online dari instance Cloud SQL, Anda harus menyiapkan database dan memilih model ML yang sesuai.
Menyiapkan database
Untuk menyiapkan database, siapkan integrasi antara Cloud SQL dan Vertex AI.
Berikan izin bagi pengguna database untuk menggunakan fungsi
ml_predict_row()
untuk menjalankan prediksi:Hubungkan klien
psql
ke instance utama, seperti yang dijelaskan dalam Menghubungkan menggunakan klien psql.Di command prompt
psql
, hubungkan ke database dan berikan izin:\c DB_NAME GRANT EXECUTE ON FUNCTION ml_predict_row TO USER_NAME;
Ganti kode berikut:
DB_NAME: nama database yang izinnya Anda berikan
USER_NAME: nama pengguna yang diberi izin oleh Anda
Memilih model ML
Saat memanggil fungsi ml_predict_row()
, Anda harus menentukan lokasi model ML. Model yang Anda tentukan
dapat berupa salah satu dari berikut ini:
Model yang berjalan di Vertex AI Model Garden.
Fungsi
ml_predict_row()
mendukung pemanggilan prediksi hanya pada model tabel atau kustom.Model Vertex AI dengan endpoint aktif yang dapat Anda akses dengan izin Identity and Access Management (IAM).
Cloud SQL tidak mendukung endpoint pribadi untuk mendapatkan prediksi online.
Memanggil prediksi online
Anda dapat menggunakan fungsi SQL ml_predict_row()
untuk memanggil prediksi online terhadap data Anda.
Format argumen awal fungsi bergantung pada apakah model ML yang ingin Anda gunakan berada di Vertex AI Model Garden atau merupakan endpoint yang berjalan di project Google Cloud .
Menggunakan model di Vertex AI Model Garden
Untuk memanggil prediksi online menggunakan model ML yang berjalan di
Vertex AI Model Garden, gunakan sintaksis berikut untuk
fungsi SQL ml_predict_row()
:
sql
SELECT ML_PREDICT_ROW('publishers/google/models/MODEL_ID', '{ "instances": [ INSTANCES ], "parameters":
PARAMETERS }');
Lakukan penggantian berikut:
MODEL_ID: ID model ML yang akan digunakan (misalnya,
gemini-2.0
)INSTANCES: input ke panggilan prediksi, dalam format JSON
PARAMETERS: parameter untuk panggilan prediksi, dalam format JSON
SELECT ML_PREDICT_ROW('publishers/google/models/MODEL_ID', '{ "instances": [ INSTANCES ], "parameters":
PARAMETERS }');
Menggunakan endpoint model Vertex AI
Untuk memanggil prediksi online menggunakan endpoint model Vertex AI, gunakan sintaksis berikut untuk fungsi SQL ml_predict_row()
:
sql
SELECT ML_PREDICT_ROW('endpoints/ENDPOINT_ID', '{ "instances": [ INSTANCES ], "parameters":
PARAMETERS }');
Lakukan penggantian berikut:
ENDPOINT_ID: ID endpoint model
INSTANCES: input ke panggilan prediksi, dalam format JSON
PARAMETERS: parameter untuk panggilan prediksi, dalam format JSON
Untuk informasi tentang pesan respons JSON model, lihat PredictResponse.
Contoh pemanggilan
Contoh berikut menggunakan
PaLM 2 for Text, yang tersedia
di Model Garden, untuk membuat teks berdasarkan perintah singkat yang
disediakan sebagai argumen literal ke ml_predict_row()
:
select ML_PREDICT_ROW('projects/PROJECT_ID/locations/us-central1/publishers/google/models/text-bison', '{"instances":[{"prompt": "What are three advantages of using Cloud SQL as my SQL database server?"}], "parameters":{"maxOutputTokens":1024, "topK": 40, "topP":0.8, "temperature":0.2}}');
Responsnya adalah objek JSON. Untuk informasi selengkapnya tentang format objek, lihat Isi respons.
Contoh berikutnya mengubah contoh sebelumnya dengan cara berikut:
Contoh ini menggunakan konten kolom
messages.message
database saat ini sebagai input.Contoh ini menunjukkan penggunaan fungsi
json_build_object()
sebagai bantuan untuk memformat parameter fungsi.
select ML_PREDICT_ROW('projects/PROJECT_ID/locations/us-central1/publishers/google/models/text-bison', json_build_object('instances', json_build_object('prompt', message), 'parameters', json_build_object('maxOutputTokens', 1024,'topK', 40,'topP', 0.8,'temperature', 0.2))) from messages;
Untuk setiap baris dalam tabel messages
, objek JSON yang ditampilkan kini berisi
satu entri dalam array predictions
-nya.
Karena responsnya adalah objek JSON, Anda dapat mengambil kolom tertentu darinya:
Untuk contoh argumen lainnya ke ml_predict_row()
, lihat
Coba Vertex AI Gemini API.