Membeli Throughput yang Disediakan

Halaman ini memberikan detail yang perlu dipertimbangkan sebelum berlangganan Throughput yang Disediakan, izin yang harus Anda miliki untuk melakukan atau melihat pesanan Throughput yang Disediakan, dan petunjuk untuk melakukan dan melihat pesanan Anda.

Hal yang perlu dipertimbangkan sebelum membeli

Untuk membantu Anda memutuskan apakah Anda ingin membeli Throughput yang Disediakan, pertimbangkan hal berikut:

  • Anda tidak dapat membatalkan pesanan di tengah masa berlaku.

    Pembelian Throughput yang Disediakan adalah komitmen, yang berarti Anda tidak dapat membatalkan pesanan di tengah jangka waktu. Namun, Anda dapat menambah jumlah GSU yang dibeli. Jika Anda tidak sengaja membeli komitmen atau ada masalah dengan konfigurasi, hubungiGoogle Cloud perwakilan akun Anda untuk mendapatkan bantuan.

  • Anda dapat memperpanjang langganan secara otomatis.

    Saat mengirimkan pesanan, Anda dapat memilih untuk memperpanjang langganan secara otomatis di akhir masa langganan, atau membiarkan langganan berakhir. Anda dapat membatalkan proses perpanjangan otomatis. Untuk membatalkan langganan sebelum diperpanjang otomatis, batalkan perpanjangan otomatis 30 hari sebelum awal periode berikutnya.

    Anda dapat mengonfigurasi langganan bulanan agar diperpanjang secara otomatis setiap bulan. Persyaratan mingguan tidak mendukung perpanjangan otomatis.

    Untuk mengetahui informasi selengkapnya, lihat Mengubah pesanan Throughput yang Disediakan. Anda juga dapat menghubungi Google Cloud perwakilan akun Anda untuk mendapatkan bantuan.

  • Anda dapat mengubah perilaku perpanjangan otomatis, model, versi model, atau wilayah dengan pemberitahuan.

    Setelah Anda memilih project, region, model, versi model, dan perilaku perpanjangan otomatis, serta pesanan Anda disetujui dan diaktifkan, Throughput yang Disediakan akan diaktifkan, bergantung pada kapasitas yang tersedia. Anda dapat mengubah perilaku perpanjangan otomatis, model, versi model, atau region dengan mengubah pesanan Throughput yang Disediakan yang ada menggunakan konsol Google Cloud .

    Semua perubahan diproses berdasarkan upaya terbaik dan biasanya diselesaikan dalam waktu 10 hari kerja sejak permintaan awal.

    Perubahan model terbatas pada penerbit tertentu. Misalnya, Anda dapat mengalihkan penetapan model Throughput yang Disediakan dari Google Gemini 2.0 Pro ke Google Gemini 2.0 Flash, tetapi Anda tidak dapat beralih dari Google Gemini 2.0 Flash ke Claude 3.5 Sonnet v2 dari Anthropic.

  • Secara default, kelebihan penggunaan ditagih sebagai bayar sesuai penggunaan.

    Jika throughput Anda melebihi jumlah pesanan Throughput yang Disediakan, kelebihan penggunaan akan diproses dan ditagih sebagai bayar sesuai penggunaan standar. Anda dapat mengontrol kelebihan penggunaan berdasarkan per permintaan. Untuk mengetahui informasi selengkapnya, lihat Menggunakan Throughput yang Disediakan.

Untuk mengetahui informasi tentang harga, lihat Throughput yang Disediakan.

Membeli Throughput yang Disediakan untuk model pratinjau

Anda dapat membeli Throughput yang Disediakan untuk model Google dalam pratinjau, asalkan versi model yang tersedia secara umum belum dirilis.

Jika Anda memiliki pesanan Throughput yang Disediakan yang aktif untuk model pratinjau dan versi model yang tersedia secara umum dirilis, Anda dapat melakukan salah satu hal berikut:

  • Pindahkan pesanan ke versi model yang tersedia secara umum. Perhatikan bahwa setelah memindahkan pesanan ke model yang tersedia secara umum, Anda tidak dapat mengalihkan pesanan kembali ke model pratinjau. Untuk mengetahui informasi selengkapnya tentang cara mengubah pesanan, lihat Mengubah pesanan Throughput yang Disediakan.

  • Atau, terus gunakan Throughput yang Disediakan untuk versi pratinjau model selama versi pratinjau stabil. Untuk mengetahui informasi selengkapnya tentang model stabil dan tidak digunakan lagi, lihat Versi dan siklus proses model.

Peran dan izin

Peran berikut memberikan akses penuh untuk mengelola Throughput yang Disediakan Vertex AI:

  • roles/aiplatform.provisionedThroughputAdmin: Anda dapat mengakses resource Throughput yang Disediakan Vertex AI.

Peran ini mencakup izin berikut:

Izin Deskripsi
aiplatform.googleapis.com/provisionedThroughputs.create Kirimkan pesanan Throughput yang Disediakan baru.
aiplatform.googleapis.com/provisionedThroughputs.get Melihat pesanan Throughput yang Disediakan tertentu.
aiplatform.googleapis.com/provisionedThroughputs.list Lihat semua pesanan Throughput yang Disediakan.
aiplatform.googleapis.com/provisionedThroughputs.update Ubah pesanan Throughput yang Disediakan.
aiplatform.googleapis.com/provisionedThroughputs.cancel Membatalkan pesanan tertunda atau update tertunda.

Melakukan pesanan Throughput yang Disediakan

Beberapa kemampuan Imagen mungkin tidak tersedia untuk publik. Untuk mempelajari lebih lanjut, lihat Fitur GA Terbatas dan Pratinjau.

Sebelum Anda melakukan pemesanan untuk menggunakan MedLM-large-1.5, hubungi Google Cloud perwakilan akun Anda untuk meminta akses.

Jika Anda memperkirakan QPM Anda akan melebihi 30.000, maka untuk memaksimalkan pesanan Throughput yang Disediakan, minta penyesuaian kuota untuk kuota sistem Vertex AI default Anda menggunakan informasi berikut:

  • Service: Vertex AI API.
  • Nama: Online prediction requests per minute per region
  • Jenis layanan: Kuota.
  • Dimensi: Wilayah tempat Anda memesan Throughput yang Disediakan.
  • Nilai: Ini adalah batas traffic prediksi online yang Anda pilih.

Pesanan Throughput yang Disediakan diproses berdasarkan ukuran pesanan dan kapasitas yang tersedia. Bergantung pada jumlah GSU yang diminta dan kapasitas yang tersedia, mungkin diperlukan waktu beberapa menit hingga beberapa minggu untuk memproses pesanan Anda.

Ikuti langkah-langkah berikut untuk membeli Throughput yang Disediakan:

Konsol

  1. Di konsol Google Cloud , buka halaman Throughput yang Disediakan.

    Buka Throughput yang Disediakan

  2. Untuk memulai pesanan baru, klik Pesanan baru.
  3. Masukkan Nama pesanan.
  4. Pilih Model.
  5. Pilih Region.
  6. Masukkan Jumlah unit penskalaan AI generatif (GSU) yang harus Anda beli.

    Opsional: Anda dapat menggunakan alat estimasi unit penskalaan AI Generatif untuk memperkirakan jumlah GSU yang akan Anda perlukan. Untuk menggunakan alat ini, lakukan hal berikut:

    1. Klik Alat estimasi.
    2. Pilih Model Anda.
    3. Berdasarkan model yang dipilih, masukkan detail untuk memperkirakan jumlah GSU yang diperlukan.

      • Untuk model Gemini 2.5, masukkan perintah berikut:

        • Estimasi kueri per detik yang memerlukan jaminan
        • Token teks input per kueri
        • Token gambar input per kueri
        • Token video input per kueri
        • Token audio input per kueri
        • Menghasilkan token teks respons per kueri
        • Token teks penalaran output per kueri
      • Untuk model Gemini 2.5 Flash dengan Live API, masukkan perintah berikut:

        • Estimasi kueri per detik yang memerlukan jaminan
        • Token input per kueri
        • Token audio input per kueri
        • Token video input per kueri
        • Memasukkan token memori sesi per kueri
        • Token teks output per kueri
        • Token audio output per kueri
      • Untuk model Gemini 2.5 Flash-Lite (pratinjau), masukkan perintah berikut:

        • Estimasi kueri per detik yang memerlukan jaminan
        • Token teks input per kueri
        • Token gambar input per kueri
        • Token video input per kueri
        • Token audio input per kueri
        • Token teks output per kueri
      • Untuk model Gemini 2.0, masukkan perintah berikut:

        • Estimasi kueri per detik yang memerlukan jaminan
        • Token input per kueri
        • Token gambar input per kueri
        • Token video input per kueri
        • Token audio input per kueri
        • Token teks output per kueri
      • Untuk model Imagen, masukkan yang berikut:

        • Kueri per detik
        • Gambar output per kueri
    4. Jika Anda ingin menggunakan nilai yang dimasukkan ke dalam alat estimasi, klik Gunakan yang dihitung.

  7. Pilih Jangka waktu Anda. Tersedia opsi-opsi berikut:

    • 1 minggu
    • 1 bulan
    • 3 bulan
    • 1 tahun
  8. Opsional: Pilih Tanggal dan waktu mulai untuk jangka waktu Anda (Pratinjau).

    Anda dapat memberikan tanggal dan waktu mulai dalam waktu dua minggu ke depan sejak Anda melakukan pemesanan. Jika Anda tidak menentukan tanggal dan waktu mulai, pesanan akan diproses segera setelah kapasitas tersedia. Tanggal dan waktu mulai yang diminta diproses berdasarkan upaya terbaik, dan pesanan tidak dijamin akan dipenuhi pada tanggal ini hingga status pesanan ditetapkan ke Disetujui.

    Jika tanggal mulai yang Anda minta terlalu dekat dengan tanggal saat ini, pesanan Anda mungkin disetujui dan diaktifkan setelah tanggal mulai yang Anda minta. Dalam kasus ini, tanggal akhir disesuaikan berdasarkan durasi jangka waktu yang dipilih, mulai dari tanggal aktivasi. Untuk mengetahui informasi tentang cara membatalkan pesanan yang tertunda, lihat Mengubah pesanan Throughput yang Disediakan.

  9. Dalam daftar Perpanjangan, tentukan apakah Anda ingin memperpanjang pesanan secara otomatis di akhir jangka waktu. Anda dapat menentukan opsi perpanjangan hanya jika Anda memilih 1 bulan, 3 bulan, atau 1 tahun sebagai jangka waktu.

  10. Klik Lanjutkan.

  11. Di bagian Ringkasan, tinjau perkiraan harga dan throughput untuk pesanan Anda. Baca persyaratan yang tercantum dan ditautkan dalam formulir.

  12. Untuk menyelesaikan pesanan Anda, klik Konfirmasi.

    Diperlukan waktu beberapa menit hingga beberapa minggu untuk memproses pesanan, bergantung pada ukuran pesanan dan kapasitas yang tersedia. Setelah pesanan diproses, statusnya di konsol akan berubah menjadi Aktif. Google Cloud Anda ditagih untuk pesanan hanya setelah pesanan tersebut aktif.

Mengubah urutan Throughput yang Disediakan

Tabel ini menjelaskan cara Anda dapat mengubah pesanan Throughput yang Disediakan melalui konsol Google Cloud berdasarkan status pesanan dan kondisi yang ada. Mengubah pesanan adalah fitur Pratinjau dan hanya tersedia untuk pesanan online yang dilakukan melalui konsol. Untuk perubahan pada pesanan offline, hubungi Google Cloud perwakilan akun Anda untuk mendapatkan bantuan.

Selain itu, perubahan yang dilakukan saat menggunakan konsol Google Cloud pada model atau versi model akan mengubah pesanan yang ada sambil mempertahankan tanggal berakhir langganan yang sama.

Status pesanan Tindakan Catatan Langkah-langkah di Google Cloud konsol
Menunggu peninjauan Anda dapat membatalkan pesanan.

Jika Anda memiliki perubahan tambahan pada pesanan, batalkan pesanan yang tertunda, lalu lakukan pesanan baru.

Jika Anda memiliki beberapa model, setiap model hanya dapat memiliki satu revisi pesanan tertunda atau pesanan tertunda dalam satu waktu.

Untuk membatalkan pesanan tertunda di konsol Google Cloud , lakukan hal berikut:
  1. Buka halaman Throughput yang Disediakan.
  2. Pilih Wilayah tempat pesanan tertunda Anda berada.
  3. Untuk membuka halaman Detail pesanan, klik ID pesanan untuk pesanan yang ingin Anda batalkan.
  4. Klik Cancel.
  5. Pada dialog Yakin ingin membatalkan pesanan?, klik Batalkan Pesanan.
Approved Anda tidak dapat mengubah pesanan. Pesanan menunggu aktivasi. Anda tidak dapat melakukan perubahan pada pesanan saat ini. Tidak berlaku
Aktif

Anda hanya dapat melakukan perubahan berikut jika pesanan tidak berakhir dalam lima hari ke depan atau diperpanjang secara otomatis:

  • Meningkatkan GSU pada pesanan yang ada. Peningkatan GSU diterapkan segera setelah persetujuan, terlepas dari jadwal perpanjangan otomatis.
  • Mengurangi GSU pada pesanan yang ada. Penurunan GSU diterapkan selama perpanjangan otomatis untuk jangka waktu berikutnya.
  • Mengaktifkan atau menonaktifkan perpanjangan otomatis.
  • Ubah model atau versi model.
  • Ubah wilayah.
Anda tidak dapat mengubah pesanan aktif jika masa berlakunya berakhir dalam waktu kurang dari lima hari dan tidak disiapkan untuk diperpanjang secara otomatis. Untuk mengubah pesanan aktif di konsol Google Cloud , gunakan salah satu metode berikut:
  • Di halaman Throughput yang Disediakan, klik simbol dari kolom Tindakan, lalu klik Edit.
  • Di halaman Detail pesanan, klik tombol Edit.

Periksa status pesanan

Setelah Anda mengirimkan pesanan Throughput yang Disediakan, status pesanan mungkin muncul sebagai salah satu dari berikut ini:

  • Menunggu peninjauan: Anda telah melakukan pemesanan. Karena persetujuan bergantung pada kapasitas yang tersedia untuk menyediakan pesanan Anda, pesanan Anda sedang menunggu peninjauan dan persetujuan. Untuk mengetahui informasi selengkapnya tentang status pesanan tertunda Anda, hubungi Google Cloud perwakilan akun Anda.
  • Disetujui: Google telah menyetujui pesanan Anda dan pesanan sedang menunggu aktivasi. Anda tidak dapat melakukan perubahan setelah pesanan disetujui.
  • Aktif: Google telah mengaktifkan pesanan Anda, dan penagihan akan dimulai.
  • Masa berlaku berakhir: Masa berlaku pesanan Anda telah berakhir.

Melihat pesanan Throughput yang Disediakan

Ikuti langkah-langkah berikut untuk melihat pesanan Throughput yang Disediakan:

Konsol

  1. Di konsol Google Cloud , buka halaman Throughput yang Disediakan.

    Buka Throughput yang Disediakan

  2. Pilih Region. Daftar pesanan Anda akan muncul.

Langkah berikutnya