Model Armor dapat diintegrasikan langsung ke Vertex AI baik
menggunakan setelan batas bawah maupun menggunakan
template. Mengintegrasikan Model Armor ke
Vertex AI memungkinkan Anda menyaring permintaan yang dikirim ke dan respons dari
model Gemini serta memeriksa atau memblokir permintaan atau respons jika melanggar
batas setelan minimum. Model Armor memberikan perlindungan perintah dan respons dalam Gemini API di Vertex AI untuk metode generateContent
.
Anda harus mengaktifkan Cloud Logging untuk mendapatkan visibilitas ke hasil pembersihan perintah dan respons. Lokasi yang didukung untuk integrasi ini adalah us-central1
, us-east4
, us-west1
, dan europe-west4
. Selama dalam Pratinjau, tidak ada biaya untuk menggunakan integrasi ini. Untuk mengetahui informasi harga, lihat
Harga Model Armor.
Sebelum memulai
Beri izin pengguna Model Armor ke akun layanan Vertex AI.
gcloud projects add-iam-policy-binding PROJECT_ID --member='serviceAccount:service-PROJECT_NUMBER@gcp-sa-aiplatform.iam.iam.gserviceaccount.com' --role='roles/modelarmor.user'
Ganti kode berikut:
PROJECT_ID
: ID project Google Cloud Anda.PROJECT_NUMBER
: nomor project Google Cloud Anda.
Mengonfigurasi setelan lantai
Anda menggunakan setelan nilai minimum untuk mengonfigurasi nilai minimum deteksi untuk template Model Armor. Setelan ini memverifikasi bahwa semua template baru dan yang diubah memenuhi persyaratan kebijakan minimum.
Sebelum mengonfigurasi setelan lantai, pertimbangkan hal berikut:
- Setelan batas minimum dapat ditetapkan di tingkat organisasi, folder, dan project. Antarmuka pengguna hanya tersedia untuk setelan lantai tingkat project. Untuk menetapkan setelan batas minimum di tingkat organisasi atau folder, Anda harus menggunakan API.
- Antarmuka pengguna hanya tersedia di tingkat project dan memungkinkan Anda mewarisi setelan tingkat organisasi atau folder.
Untuk mengonfigurasi setelan lantai, lihat mengonfigurasi setelan lantai.
Setelah mengonfigurasi setelan batas bawah untuk mengaktifkan sanitasi Vertex AI, Model Armor akan menyanitasi semua panggilan API generateContent
ke endpoint Gemini project menggunakan setelan filter yang ditentukan.
Contoh kode berikut menunjukkan cara menggunakan metode generateContent
.
curl -X POST -H "Content-Type: application/json" -H "Authorization: Bearer $(gcloud auth print-access-token)" "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/gemini-2.0-flash-001:generateContent" -d '{ "contents": [ { "role": "user", "parts": [ { "text": "" } ] } ] , "generationConfig": { "responseModalities": ["TEXT"] ,"temperature": 0.2 ,"maxOutputTokens": 1024 ,"topP": 0.8 } }'
Ganti kode berikut:
PROJECT_ID
: ID project Google Cloud Anda.LOCATION
: Google Cloud lokasi endpoint Gemini. Untuk lokasi yang didukung, lihat Lokasi untuk Model Armor API.
Contoh kode berikut menunjukkan respons dari metode generateContent
.
{ "promptFeedback": { "blockReason": "MODEL_ARMOR", "blockReasonMessage": "Blocked by Floor Setting. The prompt violated Responsible AI Safety settings (Harassment, Dangerous), Prompt Injection and Jailbreak filters." }, "usageMetadata": { "trafficType": "ON_DEMAND" }, "modelVersion": "gemini-2.0-flash-001", "createTime": "2025-03-26T13:14:36.961184Z", "responseId": "vP3jZ6DVOqLKnvgPqZL-8Ao" }
Mengonfigurasi template Model Armor
Model Armor juga dapat diintegrasikan dengan Vertex AI menggunakan template Model Armor. Template memungkinkan Anda mengonfigurasi cara Model Armor menyaring perintah dan respons serta menentukan konfigurasi filter keamanan.
Anda harus membuat template terlebih dahulu, lalu menggunakan template ini dengan
metode generateContent
Gemini. Untuk mengetahui informasi selengkapnya tentang template,
lihat Membuat dan mengelola template Model Armor.
Setelah mengonfigurasi template Model Armor, teruskan ID template sebagai
parameter saat melakukan panggilan ke Gemini API menggunakan metode generateContent
. Vertex AI akan merutekan permintaan ke Model Armor untuk
diproses.
Contoh kode berikut menunjukkan permintaan ke metode generateContent
.
curl -X POST -H "Content-Type: application/json" -H "Authorization: Bearer $(gcloud auth print-access-token)" "https://{LOCATION}-aiplatform.googleapis.com/v1/projects/{PROJECT_ID}/locations/{LOCATION}/publishers/google/models/gemini-2.0-flash-001:generateContent" -d '{ "contents": [ { "role": "user", "parts": [ { "text": "" } ] } ] , "generationConfig": { "responseModalities": ["TEXT"] ,"temperature": 0.2 ,"maxOutputTokens": 1024 ,"topP": 0.8 }, "model_armor_config": { "prompt_template_name": "projects/PROJECT_ID/locations/LOCATION/templates/TEMPLATE_ID", "response_template_name": "projects/PROJECT_ID/locations/LOCATION/templates/TEMPLATE_ID" } }'
Ganti kode berikut:
PROJECT_ID
: Google Cloud project ID.LOCATION
: Google Cloud lokasi endpoint Gemini. Lokasi yang didukung adalahus-central1
,us-east4
,us-west1
, daneurope-west4
.TEMPLATE_ID
: ID template Model Armor.
Contoh kode berikut menunjukkan respons dari metode generateContent
.
{ "promptFeedback": { "blockReason": "MODEL_ARMOR", "blockReasonMessage": "Blocked by Floor Setting. The prompt violated Responsible AI Safety settings (Harassment, Dangerous), Prompt Injection and Jailbreak filters." }, "usageMetadata": { "trafficType": "ON_DEMAND" }, "modelVersion": "gemini-2.0-flash-001", "createTime": "2025-03-26T13:14:36.961184Z", "responseId": "vP3jZ6DVOqLKnvgPqZL-8Ao" }