Membeli Throughput yang Disediakan

Halaman ini memberikan detail yang perlu dipertimbangkan sebelum berlangganan Provisioned Throughput, izin yang harus Anda miliki untuk membuat atau melihat pesanan Provisioned Throughput, dan petunjuk untuk membuat dan melihat pesanan.

Hal yang perlu dipertimbangkan sebelum membeli

Untuk membantu Anda memutuskan apakah ingin membeli Throughput yang Disediakan, pertimbangkan hal berikut:

  • Anda tidak dapat membatalkan pesanan di tengah masa berlakunya.

    Pembelian Throughput yang Disediakan adalah komitmen, yang berarti Anda tidak dapat membatalkan pesanan di tengah masa berlaku. Namun, Anda dapat meningkatkan jumlah GSU yang dibeli. Jika Anda tidak sengaja membeli komitmen atau ada masalah dengan konfigurasi, hubungiGoogle Cloud perwakilan akun untuk mendapatkan bantuan.

  • Anda dapat memperpanjang langganan secara otomatis.

    Saat mengirimkan pesanan, Anda dapat memilih untuk memperpanjang langganan secara otomatis di akhir masa berlakunya, atau membiarkan langganan berakhir masa berlakunya. Anda dapat membatalkan proses perpanjangan otomatis. Untuk membatalkan langganan sebelum diperpanjang otomatis, batalkan perpanjangan otomatis 30 hari sebelum awal periode berikutnya.

    Anda dapat mengonfigurasi langganan bulanan agar diperpanjang secara otomatis setiap bulan. Jangka waktu mingguan tidak mendukung perpanjangan otomatis.

    Untuk mengetahui informasi selengkapnya, lihat Mengubah urutan Provisioned Throughput. Anda juga dapat menghubungi Google Cloud perwakilan akun untuk mendapatkan bantuan.

  • Anda dapat mengubah perilaku perpanjangan otomatis, model, versi model, atau region dengan pemberitahuan.

    Setelah Anda memilih project, region, model, versi model, dan perilaku perpanjangan otomatis, serta pesanan Anda disetujui dan diaktifkan, Throughput yang Disediakan akan diaktifkan, bergantung pada kapasitas yang tersedia. Anda dapat mengubah perilaku, model, atau versi model perpanjangan otomatis menggunakan konsol Google Cloud, yang dapat Anda gunakan untuk mengubah pesanan yang ada. Untuk mengetahui informasi selengkapnya, lihat Mengubah urutan Provisioned Throughput.

    Untuk mengubah wilayah, hubungi Google Cloud perwakilan akun Anda untuk mendapatkan bantuan. Pesanan baru dengan tanggal akhir langganan baru mungkin diperlukan.

    Semua perubahan diproses berdasarkan upaya terbaik dan biasanya dipenuhi dalam waktu 10 hari kerja sejak permintaan awal.

    Perubahan model dibatasi untuk penayang tertentu. Misalnya, Anda dapat mengganti penetapan model Provisioned Throughput dari Google Gemini 2.0 Pro ke Google Gemini 2.0 Flash, tetapi Anda tidak dapat beralih dari Google Gemini 2.0 Flash ke Claude 3.5 Sonnet v2 dari Anthropic.

  • Secara default, kelebihan kuota akan ditagih sebagai bayar sesuai pemakaian.

    Jika throughput Anda melebihi jumlah pesanan Throughput yang Disediakan, kelebihan penggunaan akan diproses dan ditagih sebagai pembayaran sesuai penggunaan standar. Anda dapat mengontrol kelebihan penggunaan berdasarkan per permintaan. Untuk mengetahui informasi selengkapnya, lihat Menggunakan Provisioned Throughput.

Membeli Throughput yang Disediakan untuk jangka waktu satu minggu

Sebagai ganti langganan bulanan, Anda dapat membeli Throughput yang Disediakan untuk jangka waktu satu minggu dengan opsi untuk memberikan tanggal mulai dalam waktu dua minggu setelah melakukan pemesanan setelah mengirimkan formulir kontrol akses Throughput yang Disediakan.

Untuk mengetahui informasi tentang harga, lihat Throughput yang Disediakan.

Peran dan izin

Peran berikut memberikan akses penuh untuk mengelola Throughput yang Disediakan Vertex AI:

  • roles/aiplatform.provisionedThroughputAdmin: Anda dapat mengakses resource Throughput yang Disediakan Vertex AI.

Peran ini mencakup izin berikut:

Izin Deskripsi
aiplatform.googleapis.com/provisionedThroughputs.create Kirim pesanan Provisioned Throughput baru.
aiplatform.googleapis.com/provisionedThroughputs.get Melihat pesanan Provisioned Throughput tertentu.
aiplatform.googleapis.com/provisionedThroughputs.list Melihat semua pesanan Provisioned Throughput.
aiplatform.googleapis.com/provisionedThroughputs.update Mengubah pesanan Throughput yang Disediakan.
aiplatform.googleapis.com/provisionedThroughputs.cancel Membatalkan pesanan yang tertunda atau pembaruan yang tertunda.

Memesan Throughput yang Disediakan

Beberapa kemampuan Imagen mungkin tidak tersedia untuk umum. Untuk mempelajari lebih lanjut, lihat Fitur GA Terbatas dan Pratinjau.

Sebelum Anda melakukan pemesanan untuk menggunakan MedLM-large-1.5, hubungi Google Cloud perwakilan akun untuk meminta akses. Jika Anda memperkirakan QPM akan melebihi 30.000, untuk memaksimalkan pesanan Throughput yang Disediakan, minta peningkatan pada kuota sistem Vertex AI default menggunakan informasi berikut:

  • Service: Vertex AI API.
  • Nama: Online prediction requests per minute per region
  • Jenis layanan: Kuota.
  • Dimensi: Region tempat Anda memesan Provisioned Throughput.
  • Nilai: Ini adalah batas traffic prediksi online yang Anda pilih.

Pesanan Throughput yang Disediakan diproses berdasarkan ukuran pesanan dan kapasitas yang tersedia. Bergantung pada jumlah GSU yang diminta dan kapasitas yang tersedia, mungkin diperlukan waktu beberapa menit hingga beberapa minggu untuk memproses pesanan Anda.

Ikuti langkah-langkah berikut untuk membeli Provisioned Throughput:

Konsol

  1. Di konsol Google Cloud, buka halaman Provisioned Throughput.

    Buka Throughput yang Disediakan

  2. Untuk memulai pesanan baru, klik Pesanan baru.
  3. Masukkan Nama pesanan.
  4. Pilih Model.
  5. Pilih Region.
  6. Masukkan Jumlah unit skala AI generatif (GSUs) yang harus Anda beli.

    Opsional: Anda dapat menggunakan alat estimasi unit skala AI Generatif untuk memperkirakan jumlah GSU yang akan Anda perlukan. Untuk menggunakan alat ini, lakukan hal berikut:

    1. Klik Alat estimasi.
    2. Pilih Model Anda.
    3. Berdasarkan model yang dipilih, masukkan detail untuk memperkirakan jumlah GSU yang diperlukan.

      • Untuk model Gemini 2.0, masukkan hal berikut:

        • Estimasi kueri per detik yang memerlukan jaminan
        • Token input per kueri
        • Memasukkan token gambar per kueri
        • Memasukkan token video per kueri
        • Memasukkan token audio per kueri
        • Output token teks per kueri
      • Untuk model Imagen, masukkan hal berikut:

        • Kueri per detik
        • Output gambar per kueri
    4. Jika Anda ingin menggunakan nilai yang dimasukkan ke dalam alat estimasi, klik Gunakan yang dihitung.

  7. Pilih Persyaratan. Tersedia opsi-opsi berikut:

    • 1 minggu (tersedia di Pratinjau pribadi)
    • 1 bulan
    • 3 bulan
    • 1 tahun
  8. Opsional: Pilih Tanggal dan waktu mulai untuk jangka waktu Anda (Pratinjau).

    Anda dapat memberikan tanggal dan waktu mulai dalam waktu dua minggu ke depan sejak Anda melakukan pemesanan. Jika Anda tidak menentukan tanggal dan waktu mulai, pesanan akan diproses segera setelah kapasitas tersedia. Tanggal dan waktu mulai yang diminta diproses berdasarkan upaya terbaik, dan pesanan tidak dijamin akan dipenuhi pada tanggal ini hingga status pesanan ditetapkan ke Disetujui.

    Jika tanggal mulai yang Anda minta terlalu dekat dengan tanggal saat ini, pesanan Anda mungkin disetujui dan diaktifkan setelah tanggal mulai yang Anda minta. Dalam hal ini, tanggal akhir disesuaikan, berdasarkan durasi periode yang dipilih, mulai dari tanggal aktivasi. Untuk informasi tentang cara membatalkan pesanan yang tertunda, lihat Mengubah pesanan Provisioned Throughput.

  9. Dalam daftar Perpanjangan, tentukan apakah Anda ingin otomatis memperpanjang pesanan di akhir periode langganan. Anda hanya dapat menentukan opsi perpanjangan jika memilih 1 bulan, 3 bulan, atau 1 tahun sebagai jangka waktu.

  10. Klik Lanjutkan.

  11. Di bagian Ringkasan, tinjau estimasi harga dan throughput untuk pesanan Anda. Baca persyaratan yang tercantum dan ditautkan dalam formulir.

  12. Untuk menyelesaikan pesanan, klik Konfirmasi.

    Diperlukan waktu beberapa menit hingga beberapa minggu untuk memproses pesanan, bergantung pada ukuran pesanan dan kapasitas yang tersedia. Setelah pesanan diproses, statusnya di konsol Google Cloud akan berubah menjadi Aktif. Anda hanya akan ditagih untuk pesanan setelah pesanan tersebut aktif.

Mengubah urutan Throughput yang Disediakan

Tabel ini menjelaskan cara mengubah pesanan Provisioned Throughput melalui Konsol Google Cloud berdasarkan status pesanan dan kondisi yang ada. Mengubah pesanan adalah fitur Pratinjau dan hanya tersedia untuk pesanan online yang dilakukan melalui konsol. Untuk perubahan pada pesanan offline, hubungi Google Cloud perwakilan akun Anda untuk mendapatkan bantuan.

Selain itu, perubahan yang dilakukan saat menggunakan konsol Google Cloud pada model atau versi model Anda akan mengubah urutan yang ada sekaligus mempertahankan tanggal akhir langganan yang sama.

Status pesanan Tindakan Catatan Langkah-langkah di konsol Google Cloud
Menunggu peninjauan Anda dapat membatalkan pesanan.

Jika Anda memiliki perubahan tambahan pada pesanan, batalkan pesanan yang tertunda, lalu lakukan pesanan baru.

Jika Anda memiliki beberapa model, setiap model hanya dapat memiliki satu revisi pesanan tertunda atau pesanan tertunda dalam satu waktu.

Untuk membatalkan pesanan yang tertunda di konsol Google Cloud, lakukan hal berikut:
  1. Buka halaman Throughput yang Disediakan.
  2. Pilih Region tempat pesanan tertunda Anda berada.
  3. Untuk membuka halaman Detail pesanan, klik ID pesanan untuk pesanan yang ingin Anda batalkan.
  4. Klik Cancel.
  5. Pada dialog Yakin ingin membatalkan pesanan?, klik Batalkan Pesanan.
Aktif

Anda dapat meningkatkan GSU pada pesanan yang ada.

Anda dapat mengaktifkan atau menonaktifkan perpanjangan otomatis.

Anda dapat mengubah model atau versi model.

Jika kedua kondisi ini terpenuhi, Anda tidak dapat mengubah pesanan:
  • Tanggal habis masa berlaku pesanan kurang dari 5 hari lagi.
  • Pesanan tidak disetel untuk diperpanjang secara otomatis.
Untuk mengubah pesanan aktif di konsol Google Cloud, gunakan salah satu metode berikut:
  • Di halaman Provisioned Throughput, klik simbol dari kolom Actions, lalu klik Edit.
  • Di halaman Detail pesanan, klik tombol Edit.

Periksa status pesanan

Setelah Anda mengirimkan pesanan Provisioned Throughput, status pesanan mungkin muncul sebagai salah satu dari berikut:

  • Menunggu peninjauan: Anda telah melakukan pemesanan. Karena persetujuan bergantung pada kapasitas yang tersedia untuk menyediakan pesanan Anda, pesanan Anda sedang menunggu peninjauan dan persetujuan. Untuk mengetahui informasi selengkapnya tentang status pesanan yang tertunda, hubungi Google Cloud perwakilan akun Anda.
  • Disetujui: Google telah menyetujui pesanan Anda.
  • Aktif: Google telah mengaktifkan pesanan Anda, lalu penagihan dimulai.
  • Berakhir: Masa berlaku pesanan Anda telah berakhir.

Melihat pesanan Throughput yang Disediakan

Ikuti langkah-langkah berikut untuk melihat pesanan Throughput yang Disediakan:

Konsol

  1. Di konsol Google Cloud, buka halaman Provisioned Throughput.

    Buka Throughput yang Disediakan

  2. Pilih Region. Daftar pesanan Anda akan muncul.

Langkah berikutnya