Kuota

Dokumen ini mencantumkan kuota dan batas sistem yang berlaku untuk Document AI.

  • Kuota memiliki nilai default, tetapi biasanya Anda dapat meminta penyesuaian.
  • Batas sistem adalah nilai tetap yang tidak dapat diubah.

Google Cloud menggunakan kuota untuk membantu memastikan keadilan dan mengurangi lonjakan penggunaan dan ketersediaan resource. Kuota membatasi jumlah Google Cloud resource yang dapat digunakan Google Cloud project Anda. Kuota berlaku untuk berbagai jenis resource, termasuk komponen hardware, software, dan jaringan. Misalnya, kuota dapat membatasi jumlah panggilan API ke suatu layanan, jumlah load balancer yang digunakan secara bersamaan oleh project Anda, atau jumlah project yang dapat Anda buat. Kuota melindungi komunitas penggunaGoogle Cloud dengan mencegah kelebihan beban layanan. Kuota juga membantu Anda mengelola resource sendiri. Google Cloud

Sistem Kuota Cloud melakukan hal berikut:

Dalam sebagian besar kasus, saat Anda mencoba menggunakan resource lebih dari yang diizinkan kuotanya, sistem akan memblokir akses ke resource tersebut, dan tugas yang Anda coba lakukan akan gagal.

Kuota umumnya berlaku di level Google Cloud project Penggunaan resource dalam satu project tidak memengaruhi kuota yang tersedia di project lain. Dalam project Google Cloud , kuota dibagikan ke semua aplikasi dan alamat IP.

Dokumen ini mencantumkan kuota yang berlaku untuk Document AI.

Tingkat Layanan

Document AI mendukung dua tingkat layanan dan kuota terkait untuk permintaan pemrosesan online ke versi pemroses yang didukung AI Generatif: tingkat yang disediakan dan tingkat upaya terbaik.

Kuota tingkat yang disediakan memberikan 120 halaman per menit untuk versi prosesor dasar, seperti ekstraktor kustom v1.4 dan v1.5, serta 30 halaman per menit untuk versi prosesor dasar seperti ekstraktor kustom v1.5 Pro.

Kuota tingkat upaya terbaik menyediakan 120 untuk versi pemroses dasar seperti ekstraktor kustom v1.4 dan v1.5, 60 untuk versi pemroses Pro seperti ekstraktor kustom v1.5 Pro, dan hanya digunakan setelah kuota yang disediakan habis. Hal ini berlaku untuk kuota BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS (metrik best_effort_online_process_document_pages_us), dan BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU (metrik best_effort_online_process_document_pages_eu) di konsol.

Catatan Pengekstrak kustom v1.4 (berdasarkan Gemini 2.0 Flash) Pengekstrak kustom v1.5 (berdasarkan Gemini 2.5 Flash) Pengekstrak kustom v1.5 Pro (berdasarkan Gemini 2.5 Pro)
Disediakan 120 120 30
Upaya terbaik 120 120 60
Disediakan di tingkat organisasi 240 240 60

Jika Anda memerlukan lebih dari kuota upaya terbaik yang tercantum, Anda dapat mengajukan permintaan penambahan kuota (QIR) dengan menghubungi perwakilan tim penjualan Anda.

Untuk mengamankan kapasitas yang lebih tersedia selama traffic bervolume tinggi, baca bagian tentang cara membuat permintaan reservasi kapasitas.

Tidak ada perjanjian tingkat layanan untuk tingkat upaya terbaik.

Daftar kuota

Kuota berikut berlaku untuk Document AI. Kuota ini berlaku untuk setiap project konsol dan digunakan bersama oleh semua aplikasi dan alamat IP yang menggunakan project tersebut. Google Cloud

Jika Anda ingin memproses lebih banyak permintaan, kirimkan permintaan kuota Document AI untuk project Anda di konsol Google Cloud .

Berikan informasi tentang kebutuhan dan kasus penggunaan spesifik Anda dalam permintaan.

Kuota Permintaan Nilai Default Catatan
Permintaan per menit 1.800 per pengguna Lihat kuota di Google Cloud konsol
Permintaan proses online per menit (khusus v1beta2) 600 per project Lihat kuota di Google Cloud konsol
Permintaan proses online per menit (Amerika Serikat) 120 per project per jenis prosesor Lihat kuota di Google Cloud konsol
Permintaan proses online per menit (Uni Eropa) 120 per project per jenis prosesor Lihat kuota di Google Cloud konsol
Jumlah halaman dokumen pemrosesan online (Amerika Serikat) per menit per jenis prosesor dan versi model (Khusus Ekstraktor Kustom v1.4 dengan Gemini 2.0 Flash) 120 halaman per menit* Lihat kuota di Google Cloud konsol
Jumlah halaman dokumen proses online (Uni Eropa) per menit per jenis prosesor dan versi model (khusus Pengekstrak Kustom v1.4 dengan Gemini 2.0 Flash) 120 halaman per menit* Lihat kuota di Google Cloud konsol
Jumlah halaman dokumen proses online (Amerika Serikat) per menit per jenis prosesor dan versi model (Khusus Custom Extractor v1.5 dengan Gemini 2.5 Flash) 120 halaman per menit* Lihat kuota di Google Cloud konsol
Jumlah halaman dokumen proses online (Uni Eropa) per menit per jenis prosesor dan versi model (khusus Custom Extractor v1.5 dengan Gemini 2.5 Flash) 120 halaman per menit* Lihat kuota di Google Cloud konsol
Permintaan proses online per menit (satu region) 6 per project per jenis prosesor Lihat kuota di Google Cloud konsol
Permintaan batch processing serentak per project dan region (Amerika Serikat) 5 per project Lihat kuota di Google Cloud konsol
Permintaan proses batch serentak per project dan wilayah (Uni Eropa) 5 per project Lihat kuota di Google Cloud konsol
Permintaan batch processing serentak per pemroses (satu region) 5 per project Lihat kuota di Google Cloud konsol
Jumlah halaman dalam pemrosesan aktif (khusus v1beta2) 10.000 per project Lihat kuota di Google Cloud konsol
Permintaan pelatihan versi pemroses serentak (Amerika Serikat) 1 per project Lihat kuota di Google Cloud konsol
Permintaan pelatihan versi pemroses serentak (Uni Eropa) 1 per project Lihat kuota di Google Cloud konsol
Permintaan pelatihan versi pemroses serentak (satu region) 1 per project Lihat kuota di Google Cloud konsol
Versi pemroses kustom yang di-deploy (Amerika Serikat) 5 per project Lihat kuota di Google Cloud konsol
Versi pemroses kustom yang di-deploy (Uni Eropa) 5 per project Lihat kuota di Google Cloud konsol
Versi pemroses kustom yang di-deploy (satu region) 5 per project Lihat kuota di Google Cloud konsol
Versi pemroses generatif yang di-deploy (Amerika Serikat) 100 per project per pemroses ekstraksi kustom Lihat kuota di Google Cloud konsol
Versi pemroses generatif yang di-deploy (Uni Eropa) 100 per project per pemroses ekstraksi kustom Lihat kuota di Google Cloud konsol
Versi pemroses generatif yang di-deploy (satu region) 100 per project per pemroses ekstraksi kustom Lihat kuota di Google Cloud konsol
Permintaan dokumen impor serentak (Amerika Serikat) 3 per project Lihat kuota di Google Cloud konsol
Permintaan impor dokumen serentak (Uni Eropa) 3 per project Lihat kuota di Google Cloud konsol
Permintaan dokumen impor serentak (satu wilayah) 3 per project Lihat kuota di Google Cloud konsol
Permintaan dokumen ekspor serentak (Amerika Serikat) 1 per project Lihat kuota di Google Cloud konsol
Permintaan ekspor dokumen serentak (Uni Eropa) 1 per project Lihat kuota di Google Cloud konsol
Permintaan dokumen ekspor serentak (satu wilayah) 1 per project Lihat kuota di Google Cloud konsol

* Permintaan penyesuaian kuota belum didukung untuk versi ini.

Didukung di australia-southeast1 dengan permintaan penyesuaian kuota.

Membuat permintaan reservasi kapasitas

Reservasi kapasitas Document AI menyediakan kapasitas yang dicadangkan untuk melayani traffic prediksi real-time bervolume tinggi selama periode berlangganan, sehingga membantu memenuhi persyaratan Perjanjian Tingkat Layanan (SLA). Setiap unit sesuai dengan halaman per menit tambahan di luar kuota default.

Pemesanan kapasitas didukung dan diperlukan untuk meningkatkan kuota tingkat yang disediakan model pengekstraksi kustom v1.4 dan v1.5, termasuk versi prosesor yang di-fine-tune yang dibangun di atasnya.

Harga reservasi kapasitas adalah $300 USD untuk setiap halaman per menit tambahan per bulan.

Untuk membuat permintaan pemesanan kapasitas:

Konsol

  1. Di konsol Google Cloud , buka halaman IAM & Admin > Capacity Reservation:

    Reservasi Kapasitas

  2. Klik tombol Buat reservasi kapasitas baru di dekat header halaman. Anda akan diarahkan ke formulir permintaan dua halaman.

  3. Isi halaman Konfigurasi dengan informasi berikut:

    1. Isi nama untuk pesanan.
    2. Pilih wilayah.
    3. Pilih versi prosesor dari menu drop-down.
    4. Tulis jumlah halaman tambahan per menit yang diperlukan per bulan.
    5. Pilih jangka waktu langganan bulanan.
    6. Pilih tanggal dan waktu mulai.
    7. Pilih opsi perpanjangan otomatis dari menu drop-down.
  4. Klik Lanjutkan.

  5. Di halaman kedua, Anda akan melihat estimasi biaya per bulan. Anda harus memasukkan CONFIRM untuk memvalidasi pembelian.

  6. Klik Konfirmasi dan kirim untuk mengonfirmasi pesanan Anda.

Anda dapat melihat status permintaan di tab Reservasi Kapasitas.

Tiga kemungkinan status meliputi:

  • Tidak aktif: Langganan belum dimulai.
  • Aktif: Langganan sedang berlangsung.
  • Selesai: Langganan telah berakhir.

Hal yang harus dipertimbangkan sebelum membeli reservasi kapasitas

Untuk membantu Anda memutuskan apakah Anda ingin membeli pemesanan kapasitas, pertimbangkan hal berikut:

  • Anda tidak dapat membatalkan pesanan di tengah masa berlaku.

    Pembelian reservasi kapasitas Anda adalah komitmen, yang berarti Anda tidak dapat membatalkan pesanan di tengah jangka waktu. Namun, Anda dapat menambah jumlah GSU yang dibeli. Jika Anda tidak sengaja membeli komitmen atau ada masalah dengan konfigurasi, hubungi perwakilan akun Google Cloud Anda untuk mendapatkan bantuan.

  • Anda dapat memperpanjang langganan secara otomatis.

    Saat mengirimkan pesanan, Anda dapat memilih untuk memperpanjang langganan secara otomatis di akhir masa langganan, atau membiarkan langganan berakhir. Anda dapat membatalkan proses perpanjangan otomatis. Untuk membatalkan langganan sebelum diperpanjang otomatis, batalkan perpanjangan otomatis 30 hari sebelum awal periode berikutnya.

    Anda dapat mengonfigurasi langganan bulanan agar diperpanjang secara otomatis setiap bulan. Persyaratan mingguan tidak mendukung perpanjangan otomatis.