Kuota dan batas Vertex AI

Google Cloud menggunakan kuota untuk membantu memastikan keadilan dan mengurangi lonjakan penggunaan dan ketersediaan resource. Kuota membatasi jumlah Google Cloud resource yang dapat digunakan Google Cloud project Anda. Kuota berlaku untuk berbagai jenis resource, termasuk komponen hardware, software, dan jaringan. Misalnya, kuota dapat membatasi jumlah panggilan API ke layanan, jumlah load balancer yang digunakan secara bersamaan oleh project Anda, atau jumlah project yang dapat Anda buat. Kuota melindungi komunitas penggunaGoogle Cloud dengan mencegah kelebihan beban layanan. Kuota juga membantu Anda mengelola resource Google Cloud Anda sendiri.

Sistem Kuota Cloud melakukan hal berikut:

Pada umumnya, saat Anda mencoba menggunakan resource lebih dari kuota yang diizinkan, sistem akan memblokir akses ke resource, dan tugas yang Anda coba lakukan akan gagal.

Kuota umumnya berlaku di Google Cloud level project. Penggunaan resource di satu project tidak memengaruhi kuota yang tersedia di project lain. Dalam project Google Cloud , kuota dibagikan di semua aplikasi dan alamat IP.

Ada juga batas pada resource Vertex AI. Batas ini tidak terkait dengan sistem kuota. Batas tidak dapat diubah.

Meminta kuota

Kuota berikut berlaku untuk permintaan Vertex AI untuk project tertentu dan region yang didukung. Misalnya, dalam satu project, Anda dapat memiliki hingga 30.000 permintaan prediksi online per menit di satu region dan 30.000 permintaan prediksi online lainnya per menit di region lain yang didukung.

Jenis permintaan Permintaan per menit
Permintaan pengelolaan resource (CRUD)1 600
Permintaan pengiriman tugas atau operasi yang berjalan lama (LRO) 60
Permintaan prediksi online2 30.000
Throughput permintaan prediksi online 1,5 GB
Permintaan penjelasan online 600
Permintaan baca Deret Waktu Vertex AI TensorBoard 60.000
Permintaan ML Metadata (CRUD) 12.000
Permintaan Penyimpanan dalam Cache (CRUD) AI generatif 200
Permintaan Vertex AI Vizier (CRUD) 6.000
Permintaan layanan online Vertex AI Feature Store 300.000
Permintaan Vertex ML Metadata 12.000
Jumlah permintaan token penghitungan atau token komputasi 3.000

1Permintaan pengelolaan resource mencakup semua permintaan yang bukan tugas, LRO, permintaan prediksi online, permintaan Vertex AI Vizier, permintaan metadata ML, permintaan baca Vertex AI TensorBoard Timeseries Insights API, permintaan Vertex AI Feature Store, permintaan streaming Vertex AI Feature Store, atau permintaan Penelusuran Vektor.

2 Kuota ini hanya berlaku untuk endpoint publik.

Tugas atau LRO mencakup permintaan berikut:

  • Membuat atau menghapus set data.
  • Mengimpor atau mengekspor data ke atau dari set data.
  • Buat endpoint
  • Membuat atau menghapus tugas kustom.
  • Membuat atau menghapus tugas pelabelan data.
  • Membuat atau menghapus tugas penyesuaian hyperparameter.
  • Membuat atau menghapus tugas prediksi batch.
  • Membuat atau menghapus model.
  • Mengupload, menghapus, atau mengekspor model.
  • Membuat atau menghapus template runtime notebook.
  • Menetapkan, menghapus, memulai, atau mengupgrade runtime notebook.
  • Membuat, menghapus, atau memperbarui monitor model.
  • Membuat atau menghapus tugas pemantauan model.


Untuk informasi kuota model AI Generatif, lihat Kuota dan batas AI Generatif di Vertex AI.

Kuota model AutoML

Kuota berikut berlaku untuk setiap jenis dan tujuan data untuk project dan region tertentu. Misalnya, dalam project dan region tertentu, Anda dapat men-deploy 10 model klasifikasi gambar AutoML dan 10 model deteksi objek gambar AutoML untuk total 20 model yang di-deploy.

Gambar

Klasifikasi

Kuota Nilai
Tugas pelatihan serentak 5
Tugas pelatihan serentak dengan explainable AI 2
Tugas prediksi batch serentak 5
Tugas deployment model serentak 5
Tugas pembatalan deployment model serentak 5
Jumlah model yang di-deploy 10

Deteksi objek

Kuota Nilai
Tugas pelatihan serentak 5
Tugas prediksi batch serentak 5
Jumlah model yang di-deploy 10

Tabel

Kuota Nilai
Tugas pelatihan serentak 5
Tugas prediksi batch serentak 5
Jumlah model yang di-deploy 30

Teks

Klasifikasi

Kuota Nilai
Tugas pelatihan serentak 5
Tugas prediksi batch serentak 5
Jumlah model yang di-deploy 10

Ekstraksi entity

Kuota Nilai
Tugas pelatihan serentak 5
Tugas prediksi batch serentak 5
Jumlah model yang di-deploy 10

Analisis sentimen

Kuota Nilai
Tugas pelatihan serentak 5
Tugas prediksi batch serentak 5
Jumlah model yang di-deploy 10

Video

Pengenalan Tindakan

Kuota Nilai
Tugas pelatihan serentak 5
Tugas prediksi batch serentak 5

Klasifikasi

Kuota Nilai
Tugas pelatihan serentak 5
Tugas prediksi batch serentak 5

Pelacakan objek

Kuota Nilai
Tugas pelatihan serentak 5
Tugas prediksi batch serentak 5

Vertex AI Model Registry

Ukuran model maksimum yang didukung oleh Vertex AI Model Registry adalah 1 TB.

Batas model AutoML

Batas berikut berlaku untuk setiap jenis data untuk project dan region tertentu. Misalnya, dalam project dan region tertentu, Anda dapat menyertakan maksimal 1.000.000 gambar dalam input permintaan batch.

Gambar

Jenis batas Nilai
Ukuran file gambar Maksimum 30 MB
Gambar per set data Maksimum: 1,000,000
Label per set data Minimal: 2
Maksimal: 5000
Gambar per label Minimum: 10
Direkomendasikan: 1000
Ukuran file CSV input batch Maksimal: 100 MB
Jumlah gambar dalam input batch Maksimum: 1,000,000

Berbentuk tabel

Jenis batas Nilai
Ukuran maksimum 100 GB
Jumlah baris Antara 1.000 dan 200.000.000 baris
Jumlah kolom Antara 2 dan 1.000 kolom
Jumlah impor set data yang berjalan serentak 5 impor
Ukuran file CSV Maksimum: 10 GB per file, hingga total maksimum 100 GB

Teks

Jumlah karakter mengasumsikan karakter UTF-8.

Jenis batas Klasifikasi Ekstraksi entity Analisis sentimen
Item pelatihan 10 hingga 1.000.000 50 hingga 100.000 10 hingga 100.000
Label per set data 2 hingga 5.000 1 sampai 100 2 hingga 11
Panjang nama label 1 hingga 32 1 hingga 32 Bilangan bulat dari 0 hingga 10
Panjang span yang dianotasi T/A 1 hingga 100 karakter T/A
Melatih item per label 10 hingga 1.000.000 100 hingga 100.000 10 hingga 100.000
Ukuran item pelatihan 10 MB
5.000.000 karakter
128 KB (teks); 20 MB (PDF)
10 hingga 300.000 karakter (teks)
128 KB (teks); 2 MB (PDF)
60.000 karakter
Item yang dikirim untuk prediksi 128 KB (teks); 2 MB (PDF)
60.000 karakter
20MB 128 KB (teks); 2 MB (PDF)
60.000 karakter
Item per permintaan batch 10.000 10.000 10.000

Video

Jenis batas Nilai
Durasi video maksimum: 3 jam
Ukuran file video maksimum 50 GB
Label minimum per set data 2
Video minimum per label 10 (disarankan 1000)
Ukuran file CSV input batch Maksimal: 100 MB
Jumlah segmen video dalam input batch Maksimum: 1.000

Kuota model yang dilatih secara khusus

Kuota berikut berlaku untuk model Vertex AI yang dilatih secara khusus untuk project dan region tertentu.

Pelatihan

Kuota Nilai
Pipeline pelatihan kustom serentak 2.000
Jumlah CPU N1 dan E2 untuk pelatihan, per region
RegionNilai
us-west1 2.200
us-west2 20
us-west3 2.200
us-west4 20
us-central1 2.200
us-east1 2.200
us-east4 20
us-east5 450
us-south1 450
northamerica-northeast1 2.200
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 2.200
europe-west1 2.200
europe-west4 2.200
europe-west6 20
europe-west3 2.200
europe-north1 20
europe-central2 450
europe-west8 20
europe-west9 450
europe-southwest1 20
asia-south1 2.200
asia-southeast1 2.200
asia-southeast2 2.200
asia-east2 2.200
asia-east1 2.200
asia-northeast1 2.200
asia-northeast2 20
australia-southeast1 2.200
australia-southeast2 20
asia-northeast3 2.200
me-west1 450
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450
Jumlah CPU N2 untuk pelatihan, per region
RegionNilai
us-west1 20
us-west2 20
us-west3 20
us-west4 20
us-central1 450
us-east1 20
us-east4 20
us-east5 450
us-south1 20
northamerica-northeast1 20
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 20
europe-west1 20
europe-west4 450
europe-west6 20
europe-west3 20
europe-north1 20
europe-central2 20
europe-west8 20
europe-west9 450
europe-southwest1 20
asia-south1 20
asia-southeast1 20
asia-southeast2 20
asia-east2 20
asia-east1 450
asia-northeast1 20
asia-northeast2 20
australia-southeast1 20
australia-southeast2 20
asia-northeast3 20
me-west1 20
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450
Jumlah CPU M1 untuk pelatihan, per region
RegionNilai
us-west1 0
us-west2 0
us-west3 0
us-west4 0
us-central1 0
us-east1 0
us-east4 0
us-east5 0
us-south1 0
northamerica-northeast1 0
northamerica-northeast2 0
southamerica-east1 0
southamerica-west1 0
europe-west2 0
europe-west1 0
europe-west4 0
europe-west6 0
europe-west3 0
europe-north1 0
europe-central2 0
europe-west8 0
europe-west9 0
europe-southwest1 0
asia-south1 0
asia-southeast1 0
asia-southeast2 0
asia-east2 0
asia-east1 0
asia-northeast1 0
asia-northeast2 0
australia-southeast1 0
australia-southeast2 0
asia-northeast3 0
me-west1 0
me-central1 0
me-central2 0
europe-west12 0
africa-south1 0
Jumlah CPU C2 untuk pelatihan, per region
RegionNilai
us-west1 20
us-west2 20
us-west3 20
us-west4 20
us-central1 450
us-east1 20
us-east4 20
us-east5 450
us-south1 20
northamerica-northeast1 20
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 20
europe-west1 20
europe-west4 450
europe-west6 20
europe-west3 20
europe-north1 20
europe-central2 20
europe-west8 20
europe-west9 450
europe-southwest1 20
asia-south1 20
asia-southeast1 20
asia-southeast2 20
asia-east2 20
asia-east1 450
asia-northeast1 20
asia-northeast2 20
australia-southeast1 20
australia-southeast2 20
asia-northeast3 20
me-west1 20
me-central1 20
me-central2 20
europe-west12 20
africa-south1 20
Jumlah CPU A2 untuk pelatihan, per region
RegionNilai
us-west1 Tidak tersedia
us-west2 Tidak tersedia
us-west3 Tidak tersedia
us-west4 Tidak tersedia
us-central1 Tidak terbatas
us-east1 Tidak terbatas
us-east4 Tidak terbatas
us-east5 Tidak tersedia
us-south1 Tidak tersedia
northamerica-northeast1 Tidak tersedia
northamerica-northeast2 Tidak tersedia
southamerica-east1 Tidak tersedia
southamerica-west1 Tidak tersedia
europe-west2 Tidak tersedia
europe-west1 Tidak tersedia
europe-west4 Tidak terbatas
europe-west6 Tidak tersedia
europe-west3 Tidak tersedia
europe-north1 Tidak tersedia
europe-central2 Tidak tersedia
europe-west8 Tidak tersedia
europe-west9 Tidak tersedia
europe-southwest1 Tidak tersedia
asia-south1 Tidak tersedia
asia-southeast1 Tidak terbatas
asia-southeast2 Tidak tersedia
asia-east2 Tidak tersedia
asia-east1 Tidak tersedia
asia-northeast1 Tidak tersedia
asia-northeast2 Tidak tersedia
australia-southeast1 Tidak tersedia
australia-southeast2 Tidak tersedia
asia-northeast3 Tidak terbatas
me-west1 Tidak tersedia
me-central1 Tidak tersedia
me-central2 Tidak tersedia
europe-west12 Tidak tersedia
africa-south1 Tidak tersedia
Jumlah CPU A3 serentak untuk pelatihan, per region
WilayahNilai
us-west1 Tidak terbatas
us-west2 Tidak terbatas
us-west3 Tidak terbatas
us-west4 Tidak terbatas
us-central1 Tidak terbatas
us-east1 Tidak terbatas
us-east4 Tidak terbatas
us-east5 Tidak terbatas
us-south1 Tidak terbatas
northamerica-northeast1 Tidak terbatas
northamerica-northeast2 Tidak terbatas
southamerica-east1 Tidak terbatas
southamerica-west1 Tidak terbatas
europe-west2 Tidak terbatas
europe-west1 Tidak terbatas
europe-west4 Tidak terbatas
europe-west6 Tidak terbatas
europe-west3 Tidak terbatas
europe-north1 Tidak terbatas
europe-central2 Tidak terbatas
europe-west8 Tidak terbatas
europe-west9 Tidak terbatas
europe-southwest1 Tidak terbatas
asia-south1 Tidak terbatas
asia-southeast1 Tidak terbatas
asia-southeast2 Tidak terbatas
asia-east2 Tidak terbatas
asia-east1 Tidak terbatas
asia-northeast1 Tidak terbatas
asia-northeast2 Tidak terbatas
australia-southeast1 Tidak terbatas
australia-southeast2 Tidak terbatas
asia-northeast3 Tidak terbatas
me-west1 Tidak terbatas
me-central1 Tidak terbatas
me-central2 Tidak terbatas
europe-west12 Tidak terbatas
africa-south1 Tidak terbatas
Jumlah GPU P4 untuk pelatihan, per region
RegionNilai
us-west1 Tidak tersedia
us-west2 6
us-west3 Tidak tersedia
us-west4 Tidak tersedia
us-central1 6
us-east1 Tidak tersedia
us-east4 1
us-east5 Tidak tersedia
us-south1 Tidak tersedia
northamerica-northeast1 6
northamerica-northeast2 Tidak tersedia
southamerica-east1 Tidak tersedia
southamerica-west1 Tidak tersedia
europe-west2 Tidak tersedia
europe-west1 Tidak tersedia
europe-west4 6
europe-west6 Tidak tersedia
europe-west3 Tidak tersedia
europe-north1 Tidak tersedia
europe-central2 Tidak tersedia
europe-west8 Tidak tersedia
europe-west9 Tidak tersedia
europe-southwest1 Tidak tersedia
asia-south1 Tidak tersedia
asia-southeast1 6
asia-southeast2 Tidak tersedia
asia-east2 Tidak tersedia
asia-east1 Tidak tersedia
asia-northeast1 Tidak tersedia
asia-northeast2 Tidak tersedia
australia-southeast1 6
australia-southeast2 Tidak tersedia
asia-northeast3 Tidak tersedia
me-west1 Tidak tersedia
me-central1 Tidak tersedia
me-central2 Tidak tersedia
europe-west12 Tidak tersedia
africa-south1 Tidak tersedia
Jumlah GPU T4 untuk pelatihan, per region
RegionNilai
us-west1 2
us-west2 Tidak tersedia
us-west3 Tidak tersedia
us-west4 Tidak tersedia
us-central1 12
us-east1 2
us-east4 Tidak tersedia
us-east5 Tidak tersedia
us-south1 Tidak tersedia
northamerica-northeast1 Tidak tersedia
northamerica-northeast2 Tidak tersedia
southamerica-east1 Tidak tersedia
southamerica-west1 Tidak tersedia
europe-west2 6
europe-west1 Tidak tersedia
europe-west4 2
europe-west6 Tidak tersedia
europe-west3 0
europe-north1 Tidak tersedia
europe-central2 Tidak tersedia
europe-west8 Tidak tersedia
europe-west9 Tidak tersedia
europe-southwest1 Tidak tersedia
asia-south1 6
asia-southeast1 1
asia-southeast2 Tidak tersedia
asia-east2 Tidak tersedia
asia-east1 Tidak tersedia
asia-northeast1 6
asia-northeast2 Tidak tersedia
australia-southeast1 Tidak tersedia
australia-southeast2 Tidak tersedia
asia-northeast3 1
me-west1 Tidak tersedia
me-central1 Tidak tersedia
me-central2 Tidak tersedia
europe-west12 Tidak tersedia
africa-south1 Tidak tersedia
Jumlah GPU L4 untuk pelatihan, per region
RegionNilai
us-west1 0
us-west2 Tidak tersedia
us-west3 Tidak tersedia
us-west4 Tidak tersedia
us-central1 0
us-east1 0
us-east4 0
us-east5 Tidak tersedia
us-south1 Tidak tersedia
northamerica-northeast1 Tidak tersedia
northamerica-northeast2 0
southamerica-east1 Tidak tersedia
southamerica-west1 Tidak tersedia
europe-west2 Tidak tersedia
europe-west1 Tidak tersedia
europe-west4 0
europe-west6 Tidak tersedia
europe-west3 Tidak tersedia
europe-north1 Tidak tersedia
europe-central2 Tidak tersedia
europe-west8 Tidak tersedia
europe-west9 Tidak tersedia
europe-southwest1 Tidak tersedia
asia-south1 0
asia-southeast1 0
asia-southeast2 Tidak tersedia
asia-east2 Tidak tersedia
asia-east1 Tidak tersedia
asia-northeast1 Tidak tersedia
asia-northeast2 Tidak tersedia
australia-southeast1 Tidak tersedia
australia-southeast2 Tidak tersedia
asia-northeast3 0
me-west1 Tidak tersedia
me-central1 Tidak tersedia
me-central2 0
europe-west12 Tidak tersedia
africa-south1 Tidak tersedia
Jumlah GPU P100 untuk pelatihan, per region
RegionNilai
us-west1 30
us-west2 Tidak tersedia
us-west3 Tidak tersedia
us-west4 Tidak tersedia
us-central1 56
us-east1 30
us-east4 Tidak tersedia
us-east5 Tidak tersedia
us-south1 Tidak tersedia
northamerica-northeast1 Tidak tersedia
northamerica-northeast2 Tidak tersedia
southamerica-east1 Tidak tersedia
southamerica-west1 Tidak tersedia
europe-west2 Tidak tersedia
europe-west1 30
europe-west4 Tidak tersedia
europe-west6 Tidak tersedia
europe-west3 Tidak tersedia
europe-north1 Tidak tersedia
europe-central2 Tidak tersedia
europe-west8 Tidak tersedia
europe-west9 Tidak tersedia
europe-southwest1 Tidak tersedia
asia-south1 Tidak tersedia
asia-southeast1 Tidak tersedia
asia-southeast2 Tidak tersedia
asia-east2 Tidak tersedia
asia-east1 30
asia-northeast1 Tidak tersedia
asia-northeast2 Tidak tersedia
australia-southeast1 6
australia-southeast2 Tidak tersedia
asia-northeast3 Tidak tersedia
me-west1 Tidak tersedia
me-central1 Tidak tersedia
me-central2 Tidak tersedia
europe-west12 Tidak tersedia
africa-south1 Tidak tersedia
Jumlah GPU V100 untuk pelatihan, per region
RegionNilai
us-west1 6
us-west2 Tidak tersedia
us-west3 Tidak tersedia
us-west4 Tidak tersedia
us-central1 6
us-east1 Tidak tersedia
us-east4 Tidak tersedia
us-east5 Tidak tersedia
us-south1 Tidak tersedia
northamerica-northeast1 Tidak tersedia
northamerica-northeast2 Tidak tersedia
southamerica-east1 Tidak tersedia
southamerica-west1 Tidak tersedia
europe-west2 Tidak tersedia
europe-west1 Tidak tersedia
europe-west4 6
europe-west6 Tidak tersedia
europe-west3 Tidak tersedia
europe-north1 Tidak tersedia
europe-central2 Tidak tersedia
europe-west8 Tidak tersedia
europe-west9 Tidak tersedia
europe-southwest1 Tidak tersedia
asia-south1 Tidak tersedia
asia-southeast1 Tidak tersedia
asia-southeast2 Tidak tersedia
asia-east2 Tidak tersedia
asia-east1 6
asia-northeast1 Tidak tersedia
asia-northeast2 Tidak tersedia
australia-southeast1 Tidak tersedia
australia-southeast2 Tidak tersedia
asia-northeast3 Tidak tersedia
me-west1 Tidak tersedia
me-central1 Tidak tersedia
me-central2 Tidak tersedia
europe-west12 Tidak tersedia
africa-south1 Tidak tersedia
Jumlah GPU A100 untuk pelatihan, per region
RegionNilai
us-west1 Tidak tersedia
us-west2 Tidak tersedia
us-west3 Tidak tersedia
us-west4 Tidak tersedia
us-central1 8
us-east1 Tidak tersedia
us-east4 Tidak tersedia
us-east5 Tidak tersedia
us-south1 Tidak tersedia
northamerica-northeast1 Tidak tersedia
northamerica-northeast2 Tidak tersedia
southamerica-east1 Tidak tersedia
southamerica-west1 Tidak tersedia
europe-west2 Tidak tersedia
europe-west1 Tidak tersedia
europe-west4 8
europe-west6 Tidak tersedia
europe-west3 Tidak tersedia
europe-north1 Tidak tersedia
europe-central2 Tidak tersedia
europe-west8 Tidak tersedia
europe-west9 Tidak tersedia
europe-southwest1 Tidak tersedia
asia-south1 Tidak tersedia
asia-southeast1 8
asia-southeast2 Tidak tersedia
asia-east2 Tidak tersedia
asia-east1 Tidak tersedia
asia-northeast1 Tidak tersedia
asia-northeast2 Tidak tersedia
australia-southeast1 Tidak tersedia
australia-southeast2 Tidak tersedia
asia-northeast3 Tidak tersedia
me-west1 Tidak tersedia
me-central1 Tidak tersedia
me-central2 Tidak tersedia
europe-west12 Tidak tersedia
africa-south1 Tidak tersedia
Jumlah GPU A100 80 GB serentak untuk pelatihan, per region
WilayahNilai
us-west1 Tidak tersedia
us-west2 Tidak tersedia
us-west3 Tidak tersedia
us-west4 Tidak tersedia
us-central1 0
us-east1 Tidak tersedia
us-east4 0
us-east5 Tidak tersedia
us-south1 Tidak tersedia
northamerica-northeast1 Tidak tersedia
northamerica-northeast2 Tidak tersedia
southamerica-east1 Tidak tersedia
southamerica-west1 Tidak tersedia
europe-west2 Tidak tersedia
europe-west1 Tidak tersedia
europe-west4 0
europe-west6 Tidak tersedia
europe-west3 Tidak tersedia
europe-north1 Tidak tersedia
europe-central2 Tidak tersedia
europe-west8 Tidak tersedia
europe-west9 Tidak tersedia
europe-southwest1 Tidak tersedia
asia-south1 Tidak tersedia
asia-southeast1 0
asia-southeast2 Tidak tersedia
asia-east2 Tidak tersedia
asia-east1 Tidak tersedia
asia-northeast1 Tidak tersedia
asia-northeast2 Tidak tersedia
australia-southeast1 Tidak tersedia
australia-southeast2 Tidak tersedia
asia-northeast3 Tidak tersedia
me-west1 Tidak tersedia
me-central1 Tidak tersedia
me-central2 Tidak tersedia
europe-west12 Tidak tersedia
africa-south1 Tidak tersedia

Jika berminat, lihat dokumentasi kuota.

Jumlah GPU H100 serentak untuk pelatihan, per region
WilayahNilai
us-west1 0
us-west2 Tidak tersedia
us-west3 Tidak tersedia
us-west4 Tidak tersedia
us-central1 0
us-east1 Tidak tersedia
us-east4 0
us-east5 0
us-south1 Tidak tersedia
northamerica-northeast1 Tidak tersedia
northamerica-northeast2 Tidak tersedia
southamerica-east1 Tidak tersedia
southamerica-west1 Tidak tersedia
europe-west2 Tidak tersedia
europe-west1 Tidak tersedia
europe-west4 0
europe-west6 Tidak tersedia
europe-west3 Tidak tersedia
europe-north1 Tidak tersedia
europe-central2 Tidak tersedia
europe-west8 Tidak tersedia
europe-west9 Tidak tersedia
europe-southwest1 Tidak tersedia
asia-south1 Tidak tersedia
asia-southeast1 0
asia-southeast2 Tidak tersedia
asia-east2 Tidak tersedia
asia-east1 Tidak tersedia
asia-northeast1 0
asia-northeast2 Tidak tersedia
australia-southeast1 Tidak tersedia
australia-southeast2 Tidak tersedia
asia-northeast3 Tidak tersedia
me-west1 Tidak tersedia
me-central1 Tidak tersedia
me-central2 Tidak tersedia
europe-west12 Tidak tersedia
africa-south1 Tidak tersedia
Jumlah GPU Mega H100 serentak untuk pelatihan, per region
WilayahNilai
us-west1 0
us-west2 Tidak tersedia
us-west3 Tidak tersedia
us-west4 0
us-central1 0
us-east1 Tidak tersedia
us-east4 0
us-east5 0
us-south1 Tidak tersedia
northamerica-northeast1 Tidak tersedia
northamerica-northeast2 Tidak tersedia
southamerica-east1 Tidak tersedia
southamerica-west1 Tidak tersedia
europe-west2 Tidak tersedia
europe-west1 0
europe-west4 0
europe-west6 Tidak tersedia
europe-west3 Tidak tersedia
europe-north1 Tidak tersedia
europe-central2 Tidak tersedia
europe-west8 Tidak tersedia
europe-west9 Tidak tersedia
europe-southwest1 Tidak tersedia
asia-south1 Tidak tersedia
asia-southeast1 0
asia-southeast2 Tidak tersedia
asia-east2 Tidak tersedia
asia-east1 Tidak tersedia
asia-northeast1 0
asia-northeast2 Tidak tersedia
australia-southeast1 0
australia-southeast2 Tidak tersedia
asia-northeast3 Tidak tersedia
me-west1 Tidak tersedia
me-central1 Tidak tersedia
me-central2 Tidak tersedia
europe-west12 Tidak tersedia
africa-south1 Tidak tersedia

Jika berminat, lihat dokumentasi kuota.

Jumlah core TPU V2 untuk pelatihan, per region
RegionNilai
us-west1 Tidak tersedia
us-west2 Tidak tersedia
us-west3 Tidak tersedia
us-west4 Tidak tersedia
us-central1 8
us-east1 Tidak tersedia
us-east4 Tidak tersedia
us-east5 Tidak tersedia
us-south1 Tidak tersedia
northamerica-northeast1 Tidak tersedia
northamerica-northeast2 Tidak tersedia
southamerica-east1 Tidak tersedia
southamerica-west1 Tidak tersedia
europe-west2 Tidak tersedia
europe-west1 Tidak tersedia
europe-west4 8
europe-west6 Tidak tersedia
europe-west3 Tidak tersedia
europe-north1 Tidak tersedia
europe-central2 Tidak tersedia
europe-west8 Tidak tersedia
europe-west9 Tidak tersedia
europe-southwest1 Tidak tersedia
asia-south1 Tidak tersedia
asia-southeast1 Tidak tersedia
asia-southeast2 Tidak tersedia
asia-east2 Tidak tersedia
asia-east1 8
asia-northeast1 Tidak tersedia
asia-northeast2 Tidak tersedia
australia-southeast1 Tidak tersedia
australia-southeast2 Tidak tersedia
asia-northeast3 Tidak tersedia
me-west1 Tidak tersedia
me-central1 Tidak tersedia
me-central2 Tidak tersedia
europe-west12 Tidak tersedia
africa-south1 Tidak tersedia
Jumlah core pod TPU V2 untuk pelatihan, per region
RegionNilai
us-west1 Tidak tersedia
us-west2 Tidak tersedia
us-west3 Tidak tersedia
us-west4 Tidak tersedia
us-central1 Tidak tersedia
us-east1 Tidak tersedia
us-east4 Tidak tersedia
us-east5 Tidak tersedia
us-south1 Tidak tersedia
northamerica-northeast1 Tidak tersedia
northamerica-northeast2 Tidak tersedia
southamerica-east1 Tidak tersedia
southamerica-west1 Tidak tersedia
europe-west2 Tidak tersedia
europe-west1 Tidak tersedia
europe-west4 Tidak tersedia
europe-west6 Tidak tersedia
europe-west3 Tidak tersedia
europe-north1 Tidak tersedia
europe-central2 Tidak tersedia
europe-west8 Tidak tersedia
europe-west9 Tidak tersedia
europe-southwest1 Tidak tersedia
asia-south1 Tidak tersedia
asia-southeast1 Tidak tersedia
asia-southeast2 Tidak tersedia
asia-east2 Tidak tersedia
asia-east1 Tidak tersedia
asia-northeast1 Tidak tersedia
asia-northeast2 Tidak tersedia
australia-southeast1 Tidak tersedia
australia-southeast2 Tidak tersedia
asia-northeast3 Tidak tersedia
me-west1 Tidak tersedia
me-central1 Tidak tersedia
me-central2 Tidak tersedia
europe-west12 Tidak tersedia
africa-south1 Tidak tersedia
Jumlah core TPU V3 untuk pelatihan, per region
RegionNilai
us-west1 Tidak tersedia
us-west2 Tidak tersedia
us-west3 Tidak tersedia
us-west4 Tidak tersedia
us-central1 8
us-east1 Tidak tersedia
us-east4 Tidak tersedia
us-east5 Tidak tersedia
us-south1 Tidak tersedia
northamerica-northeast1 Tidak tersedia
northamerica-northeast2 Tidak tersedia
southamerica-east1 Tidak tersedia
southamerica-west1 Tidak tersedia
europe-west2 Tidak tersedia
europe-west1 Tidak tersedia
europe-west4 8
europe-west6 Tidak tersedia
europe-west3 Tidak tersedia
europe-north1 Tidak tersedia
europe-central2 Tidak tersedia
europe-west8 Tidak tersedia
europe-west9 Tidak tersedia
europe-southwest1 Tidak tersedia
asia-south1 Tidak tersedia
asia-southeast1 Tidak tersedia
asia-southeast2 Tidak tersedia
asia-east2 Tidak tersedia
asia-east1 8
asia-northeast1 Tidak tersedia
asia-northeast2 Tidak tersedia
australia-southeast1 Tidak tersedia
australia-southeast2 Tidak tersedia
asia-northeast3 Tidak tersedia
me-west1 Tidak tersedia
me-central1 Tidak tersedia
me-central2 Tidak tersedia
europe-west12 Tidak tersedia
africa-south1 Tidak tersedia
Jumlah core pod TPU V3 untuk pelatihan, per region
RegionNilai
us-west1 Tidak tersedia
us-west2 Tidak tersedia
us-west3 Tidak tersedia
us-west4 Tidak tersedia
us-central1 Tidak tersedia
us-east1 Tidak tersedia
us-east4 Tidak tersedia
us-east5 Tidak tersedia
us-south1 Tidak tersedia
northamerica-northeast1 Tidak tersedia
northamerica-northeast2 Tidak tersedia
southamerica-east1 Tidak tersedia
southamerica-west1 Tidak tersedia
europe-west2 Tidak tersedia
europe-west1 Tidak tersedia
europe-west4 Tidak tersedia
europe-west6 Tidak tersedia
europe-west3 Tidak tersedia
europe-north1 Tidak tersedia
europe-central2 Tidak tersedia
europe-west8 Tidak tersedia
europe-west9 Tidak tersedia
europe-southwest1 Tidak tersedia
asia-south1 Tidak tersedia
asia-southeast1 Tidak tersedia
asia-southeast2 Tidak tersedia
asia-east2 Tidak tersedia
asia-east1 Tidak tersedia
asia-northeast1 Tidak tersedia
asia-northeast2 Tidak tersedia
australia-southeast1 Tidak tersedia
australia-southeast2 Tidak tersedia
asia-northeast3 Tidak tersedia
me-west1 Tidak tersedia
me-central1 Tidak tersedia
me-central2 Tidak tersedia
europe-west12 Tidak tersedia
africa-south1 Tidak tersedia
Penggunaan HDD (GB) selama pelatihan, per region
RegionNilai
us-west1 180.000
us-west2 3.600
us-west3 180.000
us-west4 3.600
us-central1 180.000
us-east1 180.000
us-east4 3.600
us-east5 3.600
us-south1 180.000
northamerica-northeast1 180.000
northamerica-northeast2 3.600
southamerica-east1 3.600
southamerica-west1 3.600
europe-west2 180.000
europe-west1 180.000
europe-west4 180.000
europe-west6 3.600
europe-west3 180.000
europe-north1 3.600
europe-central2 180.000
europe-west8 3.600
europe-west9 180.000
europe-southwest1 3.600
asia-south1 180.000
asia-southeast1 180.000
asia-southeast2 180.000
asia-east2 180.000
asia-east1 180.000
asia-northeast1 180.000
asia-northeast2 3.600
australia-southeast1 180.000
australia-southeast2 3.600
asia-northeast3 180.000
me-west1 180.000
me-central1 3.600
me-central2 3.600
europe-west12 3.600
africa-south1 3.600
Penggunaan SSD (GB) selama pelatihan, per region
RegionNilai
us-west1 75.000
us-west2 450
us-west3 75.000
us-west4 450
us-central1 75.000
us-east1 75.000
us-east4 450
us-east5 450
us-south1 75.000
northamerica-northeast1 75.000
northamerica-northeast2 450
southamerica-east1 450
southamerica-west1 450
europe-west2 75.000
europe-west1 75.000
europe-west4 75.000
europe-west6 450
europe-west3 75.000
europe-north1 450
europe-central2 75.000
europe-west8 450
europe-west9 75.000
europe-southwest1 450
asia-south1 75.000
asia-southeast1 75.000
asia-southeast2 75.000
asia-east2 75.000
asia-east1 75.000
asia-northeast1 75.000
asia-northeast2 450
australia-southeast1 75.000
australia-southeast2 450
asia-northeast3 75.000
me-west1 75.000
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450

Aktif

Kuota Nilai
Jumlah replika model kustom yang di-deploy 100
Jumlah CPU untuk inferensi, per region
RegionNilai
us-west1 2.200
us-west2 2.200
us-west3 2.200
us-west4 16
us-central1 2.200
us-east1 2.200
us-east4 2.200
us-east5 16
us-south1 450
northamerica-northeast1 2.200
northamerica-northeast2 450
southamerica-east1 2.200
southamerica-west1 450
europe-west2 2.200
europe-west1 2.200
europe-west4 2.200
europe-west6 2.200
europe-west3 2.200
europe-north1 16
europe-central2 450
europe-west8 16
europe-west9 16
europe-southwest1 16
asia-south1 2.200
asia-southeast1 2.200
asia-southeast2 2.200
asia-east2 2.200
asia-east1 2.200
asia-northeast1 2.200
asia-northeast2 16
australia-southeast1 2.200
australia-southeast2 16
asia-northeast3 2.200
me-west1 450
me-central1 16
me-central2 16
europe-west12 16
africa-south1 16
Jumlah GPU P100 untuk inferensi, per region
RegionNilai
us-west1 30
us-west2 Tidak tersedia
us-west3 Tidak tersedia
us-west4 Tidak tersedia
us-central1 56
us-east1 30
us-east4 Tidak tersedia
us-east5 Tidak tersedia
us-south1 Tidak tersedia
northamerica-northeast1 Tidak tersedia
northamerica-northeast2 Tidak tersedia
southamerica-east1 Tidak tersedia
southamerica-west1 Tidak tersedia
europe-west2 Tidak tersedia
europe-west1 30
europe-west4 Tidak tersedia
europe-west6 Tidak tersedia
europe-west3 Tidak tersedia
europe-north1 Tidak tersedia
europe-central2 Tidak tersedia
europe-west8 Tidak tersedia
europe-west9 Tidak tersedia
europe-southwest1 Tidak tersedia
asia-south1 Tidak tersedia
asia-southeast1 Tidak tersedia
asia-southeast2 Tidak tersedia
asia-east2 Tidak tersedia
asia-east1 30
asia-northeast1 Tidak tersedia
asia-northeast2 Tidak tersedia
australia-southeast1 Tidak tersedia
australia-southeast2 Tidak tersedia
asia-northeast3 Tidak tersedia
me-west1 Tidak tersedia
me-central1 Tidak tersedia
me-central2 Tidak tersedia
europe-west12 Tidak tersedia
africa-south1 Tidak tersedia
Jumlah GPU P4 untuk inferensi, per region
RegionNilai
us-west1 Tidak tersedia
us-west2 6
us-west3 Tidak tersedia
us-west4 Tidak tersedia
us-central1 6
us-east1 Tidak tersedia
us-east4 6
us-east5 Tidak tersedia
us-south1 Tidak tersedia
northamerica-northeast1 6
northamerica-northeast2 Tidak tersedia
southamerica-east1 Tidak tersedia
southamerica-west1 Tidak tersedia
europe-west2 Tidak tersedia
europe-west1 Tidak tersedia
europe-west4 6
europe-west6 Tidak tersedia
europe-west3 Tidak tersedia
europe-north1 Tidak tersedia
europe-central2 Tidak tersedia
europe-west8 Tidak tersedia
europe-west9 Tidak tersedia
europe-southwest1 Tidak tersedia
asia-south1 Tidak tersedia
asia-southeast1 6
asia-southeast2 Tidak tersedia
asia-east2 Tidak tersedia
asia-east1 Tidak tersedia
asia-northeast1 Tidak tersedia
asia-northeast2 Tidak tersedia
australia-southeast1 6
australia-southeast2 Tidak tersedia
asia-northeast3 Tidak tersedia
me-west1 Tidak tersedia
me-central1 Tidak tersedia
me-central2 Tidak tersedia
europe-west12 Tidak tersedia
africa-south1 Tidak tersedia
Jumlah GPU T4 untuk inferensi, per region
RegionNilai
us-west1 12
us-west2 Tidak tersedia
us-west3 Tidak tersedia
us-west4 Tidak tersedia
us-central1 12
us-east1 12
us-east4 Tidak tersedia
us-east5 Tidak tersedia
us-south1 Tidak tersedia
northamerica-northeast1 Tidak tersedia
northamerica-northeast2 Tidak tersedia
southamerica-east1 Tidak tersedia
southamerica-west1 Tidak tersedia
europe-west2 12
europe-west1 Tidak tersedia
europe-west4 12
europe-west6 Tidak tersedia
europe-west3 0
europe-north1 Tidak tersedia
europe-central2 Tidak tersedia
europe-west8 Tidak tersedia
europe-west9 Tidak tersedia
europe-southwest1 Tidak tersedia
asia-south1 6
asia-southeast1 6
asia-southeast2 Tidak tersedia
asia-east2 12
asia-east1 6
asia-northeast1 6
asia-northeast2 Tidak tersedia
australia-southeast1 Tidak tersedia
australia-southeast2 Tidak tersedia
asia-northeast3 6
me-west1 Tidak tersedia
me-central1 Tidak tersedia
me-central2 Tidak tersedia
europe-west12 Tidak tersedia
africa-south1 Tidak tersedia
Jumlah GPU L4 untuk inferensi, per region
WilayahNilai
us-west1 28
us-west2 Tidak tersedia
us-west3 Tidak tersedia
us-west4 Tidak tersedia
us-central1 28
us-east1 28
us-east4 28
us-east5 Tidak tersedia
us-south1 Tidak tersedia
northamerica-northeast1 Tidak tersedia
northamerica-northeast2 Tidak tersedia
southamerica-east1 Tidak tersedia
southamerica-west1 Tidak tersedia
europe-west2 28
europe-west1 28
europe-west4 28
europe-west6 Tidak tersedia
europe-west3 Tidak tersedia
europe-north1 Tidak tersedia
europe-central2 Tidak tersedia
europe-west8 Tidak tersedia
europe-west9 Tidak tersedia
europe-southwest1 Tidak tersedia
asia-south1 Tidak tersedia
asia-southeast1 28
asia-southeast2 Tidak tersedia
asia-east2 Tidak tersedia
asia-east1 28
asia-northeast1 28
asia-northeast2 Tidak tersedia
australia-southeast1 Tidak tersedia
australia-southeast2 Tidak tersedia
asia-northeast3 Tidak tersedia
me-west1 Tidak tersedia
me-central1 Tidak tersedia
me-central2 Tidak tersedia
europe-west12 Tidak tersedia
africa-south1 Tidak tersedia
Jumlah GPU V100 untuk inferensi, per region
RegionNilai
us-west1 6
us-west2 Tidak tersedia
us-west3 Tidak tersedia
us-west4 Tidak tersedia
us-central1 6
us-east1 Tidak tersedia
us-east4 Tidak tersedia
us-east5 Tidak tersedia
us-south1 Tidak tersedia
northamerica-northeast1 Tidak tersedia
northamerica-northeast2 Tidak tersedia
southamerica-east1 Tidak tersedia
southamerica-west1 Tidak tersedia
europe-west2 Tidak tersedia
europe-west1 Tidak tersedia
europe-west4 6
europe-west6 Tidak tersedia
europe-west3 Tidak tersedia
europe-north1 Tidak tersedia
europe-central2 Tidak tersedia
europe-west8 Tidak tersedia
europe-west9 Tidak tersedia
europe-southwest1 Tidak tersedia
asia-south1 Tidak tersedia
asia-southeast1 Tidak tersedia
asia-southeast2 Tidak tersedia
asia-east2 Tidak tersedia
asia-east1 Tidak tersedia
asia-northeast1 Tidak tersedia
asia-northeast2 Tidak tersedia
australia-southeast1 Tidak tersedia
australia-southeast2 Tidak tersedia
asia-northeast3 Tidak tersedia
me-west1 Tidak tersedia
me-central1 Tidak tersedia
me-central2 Tidak tersedia
europe-west12 Tidak tersedia
africa-south1 Tidak tersedia
Jumlah GPU A100 untuk inferensi, per region
WilayahNilai
us-west1 Tidak tersedia
us-west2 Tidak tersedia
us-west3 Tidak tersedia
us-west4 Tidak tersedia
us-central1 14
us-east1 Tidak tersedia
us-east4 Tidak tersedia
us-east5 Tidak tersedia
us-south1 Tidak tersedia
northamerica-northeast1 Tidak tersedia
northamerica-northeast2 Tidak tersedia
southamerica-east1 Tidak tersedia
southamerica-west1 Tidak tersedia
europe-west2 Tidak tersedia
europe-west1 Tidak tersedia
europe-west4 14
europe-west6 Tidak tersedia
europe-west3 Tidak tersedia
europe-north1 Tidak tersedia
europe-central2 Tidak tersedia
europe-west8 Tidak tersedia
europe-west9 Tidak tersedia
europe-southwest1 Tidak tersedia
asia-south1 Tidak tersedia
asia-southeast1 14
asia-southeast2 Tidak tersedia
asia-east2 Tidak tersedia
asia-east1 Tidak tersedia
asia-northeast1 14
asia-northeast2 Tidak tersedia
australia-southeast1 Tidak tersedia
australia-southeast2 Tidak tersedia
asia-northeast3 14
me-west1 1
me-central1 Tidak tersedia
me-central2 Tidak tersedia
europe-west12 Tidak tersedia
africa-south1 Tidak tersedia
Jumlah GPU A100 80 GB untuk inferensi, per region
WilayahNilai
us-west1 Tidak tersedia
us-west2 Tidak tersedia
us-west3 Tidak tersedia
us-west4 Tidak tersedia
us-central1 1
us-east1 Tidak tersedia
us-east4 1
us-east5 Tidak tersedia
us-south1 Tidak tersedia
northamerica-northeast1 Tidak tersedia
northamerica-northeast2 Tidak tersedia
southamerica-east1 Tidak tersedia
southamerica-west1 Tidak tersedia
europe-west2 Tidak tersedia
europe-west1 Tidak tersedia
europe-west4 1
europe-west6 Tidak tersedia
europe-west3 Tidak tersedia
europe-north1 Tidak tersedia
europe-central2 Tidak tersedia
europe-west8 Tidak tersedia
europe-west9 Tidak tersedia
europe-southwest1 Tidak tersedia
asia-south1 Tidak tersedia
asia-southeast1 1
asia-southeast2 Tidak tersedia
asia-east2 Tidak tersedia
asia-east1 Tidak tersedia
asia-northeast1 Tidak tersedia
asia-northeast2 Tidak tersedia
australia-southeast1 Tidak tersedia
australia-southeast2 Tidak tersedia
asia-northeast3 Tidak tersedia
me-west1 Tidak tersedia
me-central1 Tidak tersedia
me-central2 Tidak tersedia
europe-west12 Tidak tersedia
africa-south1 Tidak tersedia
Jumlah GPU H100 untuk inferensi, per region
WilayahNilai
us-west1 8
us-west2 Tidak tersedia
us-west3 Tidak tersedia
us-west4 Tidak tersedia
us-central1 8
us-east1 Tidak tersedia
us-east4 0
us-east5 Tidak tersedia
us-south1 Tidak tersedia
northamerica-northeast1 Tidak tersedia
northamerica-northeast2 Tidak tersedia
southamerica-east1 Tidak tersedia
southamerica-west1 Tidak tersedia
europe-west2 Tidak tersedia
europe-west1 Tidak tersedia
europe-west4 8
europe-west6 Tidak tersedia
europe-west3 Tidak tersedia
europe-north1 Tidak tersedia
europe-central2 Tidak tersedia
europe-west8 Tidak tersedia
europe-west9 Tidak tersedia
europe-southwest1 Tidak tersedia
asia-south1 Tidak tersedia
asia-southeast1 8
asia-southeast2 Tidak tersedia
asia-east2 Tidak tersedia
asia-east1 Tidak tersedia
asia-northeast1 Tidak tersedia
asia-northeast2 Tidak tersedia
australia-southeast1 Tidak tersedia
australia-southeast2 Tidak tersedia
asia-northeast3 Tidak tersedia
me-west1 Tidak tersedia
me-central1 Tidak tersedia
me-central2 Tidak tersedia
europe-west12 Tidak tersedia
africa-south1 Tidak tersedia
Jumlah Chip TPU v5e untuk inferensi, per region
WilayahNilai
us-west1 4
us-west2 Tidak tersedia
us-west3 Tidak tersedia
us-west4 Tidak tersedia
us-central1 Tidak tersedia
us-east1 Tidak tersedia
us-east4 Tidak tersedia
us-east5 Tidak tersedia
us-south1 Tidak tersedia
northamerica-northeast1 Tidak tersedia
northamerica-northeast2 Tidak tersedia
southamerica-east1 Tidak tersedia
southamerica-west1 Tidak tersedia
europe-west2 Tidak tersedia
europe-west1 Tidak tersedia
europe-west4 Tidak tersedia
europe-west6 Tidak tersedia
europe-west3 Tidak tersedia
europe-north1 Tidak tersedia
europe-central2 Tidak tersedia
europe-west8 Tidak tersedia
europe-west9 Tidak tersedia
europe-southwest1 Tidak tersedia
asia-south1 Tidak tersedia
asia-southeast1 Tidak tersedia
asia-southeast2 Tidak tersedia
asia-east2 Tidak tersedia
asia-east1 Tidak tersedia
asia-northeast1 Tidak tersedia
asia-northeast2 Tidak tersedia
australia-southeast1 Tidak tersedia
australia-southeast2 Tidak tersedia
asia-northeast3 Tidak tersedia
me-west1 Tidak tersedia
me-central1 Tidak tersedia
me-central2 Tidak tersedia
europe-west12 Tidak tersedia
africa-south1 Tidak tersedia

Batas model yang dilatih khusus

Batas berikut berlaku untuk model Vertex AI yang dilatih secara khusus untuk project dan region tertentu.

Aktif

Batas Nilai
Jumlah replika per project 200
Jumlah penampung per cluster 25.000

Vertex AI Feature Store

Bagian ini mencantumkan kuota dan batas untuk hal berikut:

Vertex AI Feature Store

Kuota berikut berlaku untuk project dan region tertentu. Misalnya, dalam satu project, Anda dapat memiliki 200 node inferensi online di us-central1 dan 50 node lainnya di us-east4.

Kuota Nilai
Permintaan inferensi online per menit 300.000
Jumlah maksimum instans FeatureOnlineStore 10
Jumlah maksimum permintaan penelusuran per menit 6.000.000
Jumlah maksimum node penyaluran online di semua instans FeatureOnlineStore yang Dioptimalkan dalam project 80
Jumlah maksimum instans FeatureView di instans FeatureOnlineStore 30

Vertex AI Feature Store juga memiliki batas berikut. Anda tidak dapat meminta penambahan jumlah untuk batas apa pun dalam tabel berikut:

Batas Nilai
Jumlah maksimum resource FeatureGroup dalam project dan lokasi 250
Jumlah maksimum resource Feature dalam FeatureGroup 10.000
Ukuran maksimum data fitur per entity 5 MB
Jumlah ID entitas per permintaan inferensi online (FetchFeatureValues) 1
Panjang maksimum ID entity 4.076 karakter
Batas penyimpanan untuk node penyaluran online yang dioptimalkan 200 GB

Vertex AI Feature Store (Lama)

Kuota berikut berlaku untuk project dan region tertentu. Misalnya, dalam satu project, Anda dapat memiliki 75 tugas batch serentak di us-central1 dan 75 tugas lainnya di europe-west4.

Kuota Nilai
Permintaan inferensi online per menit 300.000
Permintaan penyerapan streaming per menit 60.000
Throughput penulisan penyerapan streaming per menit 1,2 GB
Permintaan pembuatan fitur per menit 100
Node inferensi online di semua featurestore 30
Tugas batch serentak (gabungan nilai fitur, penyerapan, inferensi, dan penghapusan) 75
Permintaan serentak untuk menghapus nilai fitur 1
Jenis entity di semua featurestore 75

Vertex AI Feature Store (Lama) juga memiliki batas berikut. Anda tidak dapat meminta penambahan jumlah untuk batas apa pun dalam tabel berikut:

Batas Nilai
Batas penyimpanan untuk node inferensi online 5 TB
Total data di penyimpanan offline Tak terbatas
Fitur per jenis entitas 5.000
Jumlah permintaan pembuatan, update, dan penghapusan featurestore per hari per project per region 500
Untuk penyerapan streaming, ukuran per permintaan 1 MB
Untuk pembacaan streaming, jumlah entity yang dapat disertakan per permintaan 100
Untuk impor batch, jumlah file yang dapat disertakan per permintaan 5.000 untuk Avro atau 500 untuk CSV
Untuk ekspor dan inferensi batch, jumlah fitur yang dapat Anda minta 5.000
Untuk penyerapan batch dan penyerapan streaming, stempel waktu terlama yang dapat diserap oleh data fitur 4.000 hari dari tanggal saat ini

Batas retensi data di Vertex AI Feature Store (Lama) memiliki nilai default berikut, yang dapat Anda ganti:

Setelan default retensi data Nilai default
Retensi data di penyimpanan offline (stempel waktu nilai fitur terlama setelah nilai tersebut dihapus) 4.000 hari dari tanggal saat ini
Retensi data di penyimpanan online (stempel waktu nilai fitur terlama setelah nilai tersebut dihapus) 4.000 hari dari tanggal saat ini

Anda dapat mengganti batas retensi data dengan cara berikut:

  • Guna mengganti batas retensi data untuk penyimpanan online, tetapkan parameter online_storage_ttl_days saat membuat atau memperbarui featurestore.

  • Guna mengganti batas retensi data untuk penyimpanan offline, tetapkan parameter offline_storage_ttl_days saat membuat atau memperbarui jenis entitas.

Kuota berikut berlaku pada Vector Search untuk project tertentu di setiap region.

Kuota Nilai
Operasi pembuatan indeks serentak 5
Operasi update indeks serentak 5
Jumlah node indeks yang di-deploy 50
Jumlah node N2D indeks yang di-deploy 5
Jumlah Indeks 100
Permintaan Update Streaming per menit 6.000
Throughput Update Streaming (dalam KB) per menit 120.000

Vertex ML Metadata

Batas berikut berlaku untuk Vertex ML Metadata untuk project tertentu di setiap region.

Batas Nilai
Ukuran serialisasi maksimum kolom metadata dalam resource 204.800 byte
Ukuran skema metadata serialisasi maksimum 204.800 byte

Vertex AI Pipelines

Kuota dan batas berikut berlaku untuk Vertex AI Pipelines untuk project tertentu di setiap region.

Kuota Nilai
Menjalankan tugas pipeline secara paralel* 600
Operasi pipeline serentak* 300

* Operasi pipeline dan permintaan tugas yang melebihi batas ini akan dimasukkan ke dalam antrean hingga resource tersedia.

Vertex AI Pipelines memiliki batas berikut. Perlu diperhatikan bahwa, tidak seperti kuota, Anda tidak dapat meminta penambahan jumlah untuk batas.

Batas Nilai
Jumlah tugas pipeline per tugas 10.000
Artefak input dan output per tugas pipeline 100
Artefak input dan output per tugas pipeline 10.000
Ukuran maksimum payload JSON yang berisi parameter dan artefak output per tugas pipeline 131.072 byte
Waktu berjalan maksimum untuk tugas pipeline** 7 hari

* Tugas pipeline yang berjalan melebihi batas ini akan dibatalkan.

Pengoptimalan Keputusan Vertex AI

Kuota dan batas berikut berlaku untuk Pengoptimalan Keputusan Vertex AI untuk project tertentu di setiap region.

Kuota Nilai
Permintaan penyelesaian per menit 30

Kuota dan batas Colab Enterprise

Kuota dan batas Colab Enterprise dicantumkan secara terpisah. Lihat Kuota dan batas Colab Enterprise.

Penambahan kuota

Jika ingin meningkatkan kuota untuk Vertex AI, Anda dapat menggunakan konsol Google Cloud untuk meminta penambahan kuota.

Untuk mengetahui informasi selengkapnya tentang cara mengirimkan permintaan penambahan kuota, lihat bagian Melihat dan mengelola kuota berikut:

Kuota menurut wilayah dan model

Melihat dan mengedit kuota di Google Cloud console

Untuk melihat dan mengedit kuota di konsol Google Cloud , lakukan tindakan berikut:
  1. Buka halaman Kuota dan Batas Sistem.
  2. Buka Kuota dan Batas Sistem

  3. Untuk menyesuaikan kuota, salin dan tempel properti aiplatform.googleapis.com/generate_content_requests_per_minute_per_project_per_base_model di Filter. Tekan Enter.
  4. Klik tiga titik di akhir baris, lalu pilih Edit kuota.
  5. Masukkan nilai kuota baru di panel, lalu klik Kirim permintaan.

Melihat kuota permintaan per menit (RPM) menurut region dan model

Secara default, model 2.0 dan yang lebih baru menggunakan Kuota bersama dinamis (DSQ).

Pilih region untuk melihat kuota untuk setiap model yang tersedia:

Meningkatkan kuota

Jika ingin meningkatkan kuota untuk AI Generatif di Vertex AI, Anda dapat menggunakan konsol Google Cloud untuk meminta penambahan kuota.

Kuota RAG Engine

Untuk setiap layanan yang melakukan retrieval-augmented generation (RAG) menggunakan RAG Engine, kuota berikut berlaku, dengan kuota diukur sebagai permintaan per menit (RPM).
Layanan Kuota Metrik
API pengelolaan data RAG Engine 60 RPM VertexRagDataService requests per minute per region
RetrievalContexts API 1.500 RPM VertexRagService retrieve requests per minute per region
base_model: textembedding-gecko 1.500 RPM Online prediction requests per base model per minute per region per base_model

Filter tambahan yang dapat Anda tentukan adalah base_model: textembedding-gecko
Batasan berikut berlaku:
Layanan Batas Metrik
Permintaan ImportRagFiles serentak 3 RPM VertexRagService concurrent import requests per region
Jumlah file maksimum per permintaan ImportRagFiles 10.000 VertexRagService import rag files requests per region

Untuk mengetahui batas kapasitas dan kuota selengkapnya, lihat Batas kapasitas AI Generatif di Vertex AI.

Permintaan batch

Kuota dan batas untuk permintaan prediksi batch sama di semua region.

Batas permintaan prediksi batch serentak

Tabel berikut mencantumkan batas untuk jumlah permintaan prediksi batch serentak:
Batas Nilai
Model Gemini 8
Jika jumlah tugas yang dikirim melebihi batas yang dialokasikan, tugas tersebut akan ditempatkan dalam antrean dan diproses saat kapasitas batas tersedia.

Kuota permintaan prediksi batch serentak

Tabel berikut mencantumkan kuota untuk jumlah permintaan prediksi batch serentak, yang tidak berlaku untuk model Gemini:
Kuota Nilai
aiplatform.googleapis.com/textembedding_gecko_concurrent_batch_prediction_jobs 4
Jika jumlah tugas yang dikirim melebihi kuota yang dialokasikan, tugas tersebut akan ditempatkan dalam antrean dan diproses saat kapasitas kuota tersedia.

Kuota model yang dilatih secara khusus

Kuota berikut berlaku untuk AI Generatif pada model yang disesuaikan Vertex AI untuk project dan region tertentu:
Kuota Nilai
Core pod TPU V3 pelatihan gambar yang dibatasi per region
* Region yang didukung - europe-west4
64
GPU Nvidia A100 80 GB untuk pelatihan gambar yang dibatasi per region
* Region yang didukung - us-central1
* Region yang didukung - us-east4

8
2
* Skenario penyesuaian memiliki reservasi akselerator di region tertentu. Kuota untuk penyesuaian didukung dan harus diminta di wilayah tertentu.

Batas penyematan teks

Setiap permintaan model penyematan teks dapat memiliki hingga 250 teks input (menghasilkan 1 penyematan per teks input) dan 20.000 token per permintaan. Hanya 2.048 token pertama dalam setiap teks input yang digunakan untuk menghitung penyematan.

Untuk text-embedding-large-exp-03-07, setiap permintaan hanya dapat menyertakan satu teks input. Kuota untuk model ini tercantum dengan nama text-embedding-large-001.

Kuota layanan layanan evaluasi AI generatif

Layanan evaluasi AI Generatif menggunakan gemini-2.0-flash sebagai model hakim default untuk metrik berbasis model. Satu permintaan evaluasi untuk metrik berbasis model dapat menghasilkan beberapa permintaan pokok ke layanan evaluasi AI Generatif. Kuota setiap model dihitung berdasarkan per project, yang berarti bahwa setiap permintaan yang diarahkan ke gemini-2.0-flash untuk inferensi model dan evaluasi berbasis model berkontribusi pada kuota. Kuota untuk layanan evaluasi AI Generatif dan model hakim yang mendasarinya ditampilkan dalam tabel berikut:
Kuota permintaan Kuota default
Permintaan layanan evaluasi AI generatif per menit 1.000 permintaan per project per region
Permintaan prediksi online per menit untuk
base_model: gemini-2.0-flash
Lihat Kuota menurut wilayah dan model.

Jika Anda menerima error terkait kuota saat menggunakan layanan evaluasi Gen AI, Anda mungkin perlu mengajukan permintaan penambahan kuota. Lihat Melihat dan mengelola kuota untuk mengetahui informasi selengkapnya.

Batas Nilai
Waktu tunggu permintaan layanan evaluasi AI generatif habis 60 detik

Saat menggunakan layanan evaluasi AI Generatif untuk pertama kalinya dalam project baru, Anda mungkin mengalami penundaan penyiapan awal hingga dua menit. Jika permintaan pertama Anda gagal, tunggu beberapa menit, lalu coba lagi. Permintaan evaluasi berikutnya biasanya selesai dalam waktu 60 detik.

Token input dan output maksimum untuk metrik berbasis model bergantung pada model yang digunakan sebagai model hakim. Lihat Model Google untuk mengetahui daftar model.

Kuota evaluasi pipeline

Jika Anda menerima error terkait kuota saat menggunakan layanan pipeline evaluasi, Anda mungkin perlu mengajukan permintaan penambahan kuota. Lihat Melihat dan mengelola kuota untuk mengetahui informasi selengkapnya. Layanan pipeline evaluasi menggunakan Vertex AI Pipelines untuk menjalankan PipelineJobs. Lihat kuota yang relevan untuk Vertex AI Pipelines. Berikut adalah rekomendasi kuota umum:
Layanan Kuota Rekomendasi
Vertex AI API Tugas prediksi batch LLM serentak per wilayah Pointwise: 1 * num_concurrent_pipelines

Pairwise: 2 * num_concurrent_pipelines
Vertex AI API Permintaan evaluasi per menit per region 1000 * num_concurrent_pipelines
Selain itu, kuota yang relevan untuk metrik berbasis model bergantung pada model hakim yang Anda gunakan:
Tasks Kuota Model dasar Rekomendasi
summarization
question_answering
Permintaan prediksi online per model dasar per menit per region per base_model text-bison 60 * num_concurrent_pipelines

Vertex AI Agent Engine

Kuota dan batas berikut berlaku untuk Vertex AI Agent Engine untuk project tertentu di setiap region.
Kuota Nilai
Membuat/Menghapus/Memperbarui Mesin Agen Vertex AI per menit 10
Mesin Agen Vertex AI Query/StreamQuery per menit 60
Jumlah maksimum resource Vertex AI Agent Engine 100

Memecahkan masalah kode error 429

Untuk memecahkan masalah error 429, lihat Kode error 429.

Langkah berikutnya