Error AI Generatif di Vertex AI inference API

Panduan ini memberikan daftar error yang mungkin Anda temui saat menggunakan Referensi API Model untuk AI Generatif. Error ini mengikuti model error Google Cloud API, yang merekomendasikan agar kami memberikan panduan tentang penyebab dan solusi khusus untuk model AI generatif.

Error API

Tabel ini menyediakan kode dan deskripsi error API.

Kode error HTTP Kode error kanonis Penyebab Contoh Solusi
400 INVALID_ARGUMENT / FAILED_PRECONDITION Permintaan gagal divalidasi API, atau Anda mencoba mengakses model yang memerlukan izin masuk atau tidak diizinkan oleh kebijakan organisasi. Permintaan melebihi batas token input model. Lihat Referensi Model API untuk AI Generatif untuk mengetahui parameter permintaan, jumlah token, dan parameter lainnya.
403 PERMISSION_DENIED Klien tidak memiliki izin yang memadai untuk memanggil API. Akun layanan tidak memiliki izin untuk mengakses bucket Cloud Storage yang menghosting resource gambar atau video. 1. Pastikan semua API yang diperlukan diaktifkan, dan akun layanan memiliki izin yang tepat untuk mengakses layanan Vertex AI yang dipilih.

2. Akun layanan per-produk, per-project (P4SA) Vertex AI diberi izin yang diperlukan untuk mengakses resource yang dirujuk dalam input.
404 NOT_FOUND Tidak ada objek valid yang ditemukan dari URL yang ditentukan. File gambar tidak ditemukan di URL penyimpanan. Periksa dan perbaiki lokasi file.
429 RESOURCE_EXHAUSTED Bergantung pada pesan error, error dapat disebabkan oleh hal berikut:

1. Kuota API melebihi batas.

2. Server kelebihan beban karena kapasitas server bersama.

3. Anda telah mencapai batas harian untuk permintaan menggunakan logprobs.
Gemini API melampaui batas permintaan per menit. 1. Periksa batas kuota Vertex AI Generative AI. Jika perlu, ajukan permohonan untuk mendapatkan kuota yang lebih tinggi.

2. Coba lagi setelah beberapa detik. Jika error berlanjut setelah jangka waktu yang lama (berjam-jam), hubungi dukungan Vertex AI.

3. Pertimbangkan untuk membeli Throughput yang Disediakan.
499 CANCELLED Permintaan dibatalkan oleh klien.
500 UNKNOWN / INTERNAL Error server karena kelebihan beban atau kegagalan dependensi. Permintaan dibatasi, karena layanan kelebihan beban untuk sementara. Coba lagi setelah beberapa detik. Jika error berlanjut setelah jangka waktu yang lama (berjam-jam), hubungi dukungan Vertex AI.
503 UNAVAILABLE Layanan tidak tersedia untuk sementara. Server tidak merespons permintaan masuk. Status tidak tersedia mungkin bersifat sementara. Namun, jika error tetap berlanjut, hubungi dukungan Vertex AI.
504 DEADLINE_EXCEEDED Klien menetapkan batas waktu yang lebih singkat daripada batas waktu default server (10 menit), dan permintaan tidak selesai dalam batas waktu yang diberikan klien. Pertimbangkan untuk memperpanjang batas waktu yang diberikan klien.

Menangani error

Hindari lonjakan traffic. Lonjakan adalah peningkatan jumlah permintaan secara tiba-tiba dan signifikan dalam jangka waktu yang sangat singkat. Terkadang, lonjakan traffic dapat menyebabkan masalah pada penegakan kuota dan meningkatkan kemungkinan server kelebihan beban.

Berhati-hatilah saat mencoba lagi peristiwa. Sebaiknya coba lagi maksimal dua kali. Penundaan minimum adalah satu detik dengan permintaan berikutnya yang dicadangkan secara eksponensial.

Langkah berikutnya