Dokumen ini mencantumkan kuota dan batas sistem yang berlaku untuk Document AI.
- Kuota memiliki nilai default, tetapi biasanya Anda dapat meminta penyesuaian.
- Batas sistem adalah nilai tetap yang tidak dapat diubah.
Google Cloud menggunakan kuota untuk membantu memastikan keadilan dan mengurangi lonjakan penggunaan dan ketersediaan resource. Kuota membatasi jumlah Google Cloud resource yang dapat digunakan Google Cloud project Anda. Kuota berlaku untuk berbagai jenis resource, termasuk komponen hardware, software, dan jaringan. Misalnya, kuota dapat membatasi jumlah panggilan API ke suatu layanan, jumlah load balancer yang digunakan secara bersamaan oleh project Anda, atau jumlah project yang dapat Anda buat. Kuota melindungi komunitas penggunaGoogle Cloud dengan mencegah kelebihan beban layanan. Kuota juga membantu Anda mengelola resource sendiri. Google Cloud
Sistem Kuota Cloud melakukan hal berikut:
- Memantau penggunaan Google Cloud produk dan layanan
- Membatasi pemakaian resource tersebut
- Menyediakan cara untuk meminta perubahan pada nilai kuota dan mengotomatiskan penyesuaian kuota
Dalam sebagian besar kasus, saat Anda mencoba menggunakan resource lebih dari yang diizinkan kuotanya, sistem akan memblokir akses ke resource tersebut, dan tugas yang Anda coba lakukan akan gagal.
Kuota umumnya berlaku di level Google Cloud project Penggunaan resource dalam satu project tidak memengaruhi kuota yang tersedia di project lain. Dalam project Google Cloud , kuota dibagikan ke semua aplikasi dan alamat IP.
Dokumen ini mencantumkan kuota yang berlaku untuk Document AI.
Tingkat Layanan
Document AI mendukung dua tingkat layanan dan kuota terkait untuk permintaan pemrosesan online ke versi pemroses yang didukung AI Generatif: tingkat yang disediakan dan tingkat upaya terbaik.
Kuota tingkat yang disediakan memberikan 120 halaman per menit untuk versi prosesor dasar, seperti ekstraktor kustom v1.4 dan v1.5, serta 30 halaman per menit untuk versi prosesor dasar seperti ekstraktor kustom v1.5 Pro.
Kuota tingkat upaya terbaik menyediakan 120 untuk versi pemroses dasar seperti ekstraktor kustom v1.4 dan v1.5, 60 untuk versi pemroses Pro seperti ekstraktor kustom v1.5 Pro, dan hanya digunakan setelah kuota yang disediakan habis. Hal ini berlaku untuk
kuota BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS
(metrik best_effort_online_process_document_pages_us
), dan
BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU
(metrik best_effort_online_process_document_pages_eu
) di konsol.
Catatan | Pengekstrak kustom v1.4 (berdasarkan Gemini 2.0 Flash) | Pengekstrak kustom v1.5 (berdasarkan Gemini 2.5 Flash) | Pengekstrak kustom v1.5 Pro (berdasarkan Gemini 2.5 Pro) |
---|---|---|---|
Disediakan | 120 | 120 | 30 |
Upaya terbaik | 120 | 120 | 60 |
Disediakan di tingkat organisasi | 240 | 240 | 60 |
Jika Anda memerlukan lebih dari kuota upaya terbaik yang tercantum, Anda dapat mengajukan permintaan penambahan kuota (QIR) dengan menghubungi perwakilan tim penjualan Anda.
Untuk mengamankan kapasitas yang lebih tersedia selama traffic bervolume tinggi, baca bagian tentang cara membuat permintaan reservasi kapasitas.
Tidak ada perjanjian tingkat layanan untuk tingkat upaya terbaik.
Daftar kuota
Kuota berikut berlaku untuk Document AI. Kuota ini berlaku untuk setiap project konsol dan digunakan bersama oleh semua aplikasi dan alamat IP yang menggunakan project tersebut. Google Cloud
Jika Anda ingin memproses lebih banyak permintaan, kirimkan permintaan kuota Document AI untuk project Anda di konsol Google Cloud .
Berikan informasi tentang kebutuhan dan kasus penggunaan spesifik Anda dalam permintaan.
Kuota Permintaan | Nilai Default | Catatan |
---|---|---|
Permintaan per menit | 1.800 per pengguna | Lihat kuota di Google Cloud konsol |
Permintaan proses online per menit (khusus v1beta2) | 600 per project | Lihat kuota di Google Cloud konsol |
Permintaan proses online per menit (Amerika Serikat) | 120 per project per jenis prosesor | Lihat kuota di Google Cloud konsol |
Permintaan proses online per menit (Uni Eropa) | 120 per project per jenis prosesor | Lihat kuota di Google Cloud konsol |
Jumlah halaman dokumen pemrosesan online (Amerika Serikat) per menit per jenis prosesor dan versi model (Khusus Ekstraktor Kustom v1.4 dengan Gemini 2.0 Flash) | 120 halaman per menit* | Lihat kuota di Google Cloud konsol |
Jumlah halaman dokumen proses online (Uni Eropa) per menit per jenis prosesor dan versi model (khusus Pengekstrak Kustom v1.4 dengan Gemini 2.0 Flash) | 120 halaman per menit* | Lihat kuota di Google Cloud konsol |
Jumlah halaman dokumen proses online (Amerika Serikat) per menit per jenis prosesor dan versi model (Khusus Custom Extractor v1.5 dengan Gemini 2.5 Flash) | 120 halaman per menit* | Lihat kuota di Google Cloud konsol |
Jumlah halaman dokumen proses online (Uni Eropa) per menit per jenis prosesor dan versi model (khusus Custom Extractor v1.5 dengan Gemini 2.5 Flash) | 120 halaman per menit* | Lihat kuota di Google Cloud konsol |
Permintaan proses online per menit (satu region) | 6 per project per jenis prosesor | Lihat kuota di Google Cloud konsol |
Permintaan batch processing serentak per project dan region (Amerika Serikat) | 5 per project | Lihat kuota di Google Cloud konsol |
Permintaan proses batch serentak per project dan wilayah (Uni Eropa) | 5 per project | Lihat kuota di Google Cloud konsol |
Permintaan batch processing serentak per pemroses (satu region) | 5 per project | Lihat kuota di Google Cloud konsol |
Jumlah halaman dalam pemrosesan aktif (khusus v1beta2) | 10.000 per project | Lihat kuota di Google Cloud konsol |
Permintaan pelatihan versi pemroses serentak (Amerika Serikat) | 1 per project | Lihat kuota di Google Cloud konsol |
Permintaan pelatihan versi pemroses serentak (Uni Eropa) | 1 per project | Lihat kuota di Google Cloud konsol |
Permintaan pelatihan versi pemroses serentak (satu region) | 1 per project† | Lihat kuota di Google Cloud konsol |
Versi pemroses kustom yang di-deploy (Amerika Serikat) | 5 per project | Lihat kuota di Google Cloud konsol |
Versi pemroses kustom yang di-deploy (Uni Eropa) | 5 per project | Lihat kuota di Google Cloud konsol |
Versi pemroses kustom yang di-deploy (satu region) | 5 per project | Lihat kuota di Google Cloud konsol |
Versi pemroses generatif yang di-deploy (Amerika Serikat) | 100 per project per pemroses ekstraksi kustom | Lihat kuota di Google Cloud konsol |
Versi pemroses generatif yang di-deploy (Uni Eropa) | 100 per project per pemroses ekstraksi kustom | Lihat kuota di Google Cloud konsol |
Versi pemroses generatif yang di-deploy (satu region) | 100 per project per pemroses ekstraksi kustom | Lihat kuota di Google Cloud konsol |
Permintaan dokumen impor serentak (Amerika Serikat) | 3 per project | Lihat kuota di Google Cloud konsol |
Permintaan impor dokumen serentak (Uni Eropa) | 3 per project | Lihat kuota di Google Cloud konsol |
Permintaan dokumen impor serentak (satu wilayah) | 3 per project | Lihat kuota di Google Cloud konsol |
Permintaan dokumen ekspor serentak (Amerika Serikat) | 1 per project | Lihat kuota di Google Cloud konsol |
Permintaan ekspor dokumen serentak (Uni Eropa) | 1 per project | Lihat kuota di Google Cloud konsol |
Permintaan dokumen ekspor serentak (satu wilayah) | 1 per project | Lihat kuota di Google Cloud konsol |
* Permintaan penyesuaian kuota belum didukung untuk versi ini.
† Didukung di australia-southeast1
dengan permintaan penyesuaian kuota.
Membuat permintaan reservasi kapasitas
Reservasi kapasitas Document AI menyediakan kapasitas yang dicadangkan untuk melayani traffic prediksi real-time bervolume tinggi selama periode berlangganan, sehingga membantu memenuhi persyaratan Perjanjian Tingkat Layanan (SLA). Setiap unit sesuai dengan halaman per menit tambahan di luar kuota default.
Pemesanan kapasitas didukung dan diperlukan untuk meningkatkan kuota tingkat yang disediakan model pengekstraksi kustom v1.4 dan v1.5, termasuk versi prosesor yang di-fine-tune yang dibangun di atasnya.
Harga reservasi kapasitas adalah $300 USD untuk setiap halaman per menit tambahan per bulan.
Untuk membuat permintaan pemesanan kapasitas:
Konsol
Di konsol Google Cloud , buka halaman IAM & Admin > Capacity Reservation:
Klik tombol Buat reservasi kapasitas baru di dekat header halaman. Anda akan diarahkan ke formulir permintaan dua halaman.
Isi halaman Konfigurasi dengan informasi berikut:
- Isi nama untuk pesanan.
- Pilih wilayah.
- Pilih versi prosesor dari menu drop-down.
- Tulis jumlah halaman tambahan per menit yang diperlukan per bulan.
- Pilih jangka waktu langganan bulanan.
- Pilih tanggal dan waktu mulai.
- Pilih opsi perpanjangan otomatis dari menu drop-down.
Klik Lanjutkan.
Di halaman kedua, Anda akan melihat estimasi biaya per bulan. Anda harus memasukkan CONFIRM untuk memvalidasi pembelian.
Klik Konfirmasi dan kirim untuk mengonfirmasi pesanan Anda.
Anda dapat melihat status permintaan di tab Reservasi Kapasitas.
Tiga kemungkinan status meliputi:
- Tidak aktif: Langganan belum dimulai.
- Aktif: Langganan sedang berlangsung.
- Selesai: Langganan telah berakhir.
Hal yang harus dipertimbangkan sebelum membeli reservasi kapasitas
Untuk membantu Anda memutuskan apakah Anda ingin membeli pemesanan kapasitas, pertimbangkan hal berikut:
Anda tidak dapat membatalkan pesanan di tengah masa berlaku.
Pembelian reservasi kapasitas Anda adalah komitmen, yang berarti Anda tidak dapat membatalkan pesanan di tengah jangka waktu. Namun, Anda dapat menambah jumlah GSU yang dibeli. Jika Anda tidak sengaja membeli komitmen atau ada masalah dengan konfigurasi, hubungi perwakilan akun Google Cloud Anda untuk mendapatkan bantuan.
Anda dapat memperpanjang langganan secara otomatis.
Saat mengirimkan pesanan, Anda dapat memilih untuk memperpanjang langganan secara otomatis di akhir masa langganan, atau membiarkan langganan berakhir. Anda dapat membatalkan proses perpanjangan otomatis. Untuk membatalkan langganan sebelum diperpanjang otomatis, batalkan perpanjangan otomatis 30 hari sebelum awal periode berikutnya.
Anda dapat mengonfigurasi langganan bulanan agar diperpanjang secara otomatis setiap bulan. Persyaratan mingguan tidak mendukung perpanjangan otomatis.