Halaman ini menjelaskan praktik terbaik untuk mengelola kuota Cloud Healthcare API. Gunakan halaman ini jika project Anda memiliki, atau mungkin memiliki, traffic dalam jumlah besar dan Anda memerlukan kuota yang lebih besar daripada yang disediakan Cloud Healthcare API secara default. Google Cloud
Kuota default Cloud Healthcare API
Kuota Cloud Healthcare API default tidak dirancang untuk semua kasus penggunaan, terutama jika Google Cloud project Anda memiliki traffic yang besar. Cloud Healthcare API tidak otomatis meningkatkan kuota. Anda harus merencanakan dan memantau penggunaan kuota.
Praktik terbaik untuk memantau dan melihat kuota
Ada beberapa metode untuk melihat penggunaan kuota Anda. Saat memperkirakan dan melihat kuota untuk Cloud Healthcare API, sebaiknya gunakan Model Kuota Layanan. Model ini memungkinkan Anda menilai secara akurat kuota yang tersedia berdasarkan kriteria berikut:
- Apakah ada penggantian admin. Akun utama yang diberi peran Quota Administrator dalam organisasi dapat menerapkan penggantian admin pada kuota di Google Cloud project dalam organisasi. Penggantian admin menggantikan batas default dan penggantian produser.
Apakah ada pengabaian produsen. Pemilik layanan memberikan penggantian produsen kepada konsumen layanan. Google Cloud adalah pemilik layanan Cloud Healthcare API. Penggantian kuota apa pun yang Google Cloud disediakan adalah penggantian produsen.
Apakah penggantian konsumen ada. Seseorang yang membuat permintaan ke Cloud Healthcare API adalah konsumen layanan Cloud Healthcare API. Anda dapat menerapkan penggantian konsumen untuk berbagai situasi, seperti membatasi kuota di projectGoogle Cloud sebagai langkah pengendalian biaya untuk mencegah penggunaan yang melebihi anggaran.
Jika Anda memiliki penggantian ini yang berlaku, Anda dapat menghitung batas kuota konsumen untuk mendapatkan penilaian akurat tentang kuota yang tersedia.
Praktik terbaik untuk meminta kuota tambahan
Google Cloud memiliki prosedur untuk meminta nilai kuota yang lebih tinggi. Untuk mempelajari cara permintaan penyesuaian kuota diproses, lihat Tentang penyesuaian kuota.
Sebelum meminta kuota tambahan, pastikan Anda telah menerapkan kedua hal berikut:
Implementasi ini dapat mengurangi jumlah kuota yang Anda perlukan karena alasan berikut:
- Kedua penerapan ini menyebarkan lonjakan beban selama beberapa jam atau menit, bukan detik.
- Kedua implementasi ini menggunakan kuota secara efisien selama periode 24 jam. Jika permintaan yang secara signifikan melebihi kuota default terjadi secara konsisten selama periode 24 jam, kumpulan resource yang lebih besar dapat dialokasikan ke layanan Cloud Healthcare API. Alokasi tambahan sumber daya hanya berdasarkan permintaan dan ditentukan berdasarkan kasus per kasus.
- Penggunaan resource yang konsisten memudahkan Google Cloud memahami persyaratan kuota Anda dan memberi Anda kuota yang dibutuhkan.
Untuk mengelola kapasitas dan kuota secara efektif, Anda perlu mengetahui persyaratan kapasitas organisasi Anda. Jika Anda merencanakan persyaratan kapasitas dan berpikir bahwa Anda akan memerlukan peningkatan kuota yang besar saat project Anda dalam produksi, minta peningkatan dari Google Cloud Customer Care. Google Cloud Layanan Pelanggan dapat membantu Anda mengalokasikan dan meningkatkan kuota selama fase pengujian dan peluncuran Google Cloud project Anda.
Anda tidak harus memiliki layanan Layanan Pelanggan berbayar untuk meminta penambahan kuota. Beberapa permintaan penambahan kuota diselesaikan dalam waktu 2-3 hari kerja, tetapi sebaiknya Anda merencanakan waktu yang lebih lama. Jika penambahan kuota Anda besar, permintaan penambahan kuota dapat memerlukan waktu 10 hari kerja atau lebih untuk diselesaikan. Bagian dari perencanaan Anda harus mencakup alokasi waktu untuk merespons Customer Care guna menyelesaikan pertanyaan atau masalah yang belum terselesaikan terkait permintaan tersebut. Jika Anda memastikan bahwa permintaan peningkatan kuota awal Anda cukup detail, Anda mungkin dapat mengurangi waktu yang dihabiskan untuk menunggu permintaan dipenuhi.
Praktik terbaik untuk mengantisipasi kebutuhan kuota
Sebelum project Google Cloud Anda masuk ke produksi, antisipasi dan rencanakan jumlah kuota yang akan Anda butuhkan. Merencanakan persyaratan kuota Anda akan mencegah pembatasan yang tidak terduga pada konsumsi resource Anda di kemudian hari.
Bagian berikut menjelaskan hal-hal yang perlu dipertimbangkan saat merencanakan kuota.
Antisipasi total penggunaan untuk semua penyimpanan dan klien data
Pahami total penggunaan Anda di semua penyimpanan data Cloud Healthcare API, dan pahami total penggunaan semua klien yang membuat permintaan ke projectGoogle Cloud Anda.
- Beberapa project Google Cloud menerapkan beberapa kasus penggunaan Cloud Healthcare API. Misalnya, Google Cloud project Anda mungkin menggunakan beberapa set data dan penyimpanan data Cloud Healthcare API untuk berbagai jenis data, sehingga meningkatkan total penggunaan kuota Anda.
- Kuota diterapkan per project dan per region.Google Cloud Pastikan Anda memiliki pengukuran yang akurat untuk kuota yang diperlukan di beberapa region. Jika memiliki beberapa project Google Cloud , Anda mungkin memerlukan pengukuran yang lebih akurat di seluruh project. Untuk mengetahui informasi selengkapnya tentang perencanaan kuota per region, lihat artikel Memperkirakan penggunaan per region.
- Cloud Healthcare API tidak menyeimbangkan kuota beban di seluruh klien, set data, atau
penyimpanan data. Klien harus menentukan apakah akan menerapkan skema
prioritas untuk memastikan bahwa traffic yang paling penting tidak mengalami
error
429 RESOURCE_EXHAUSTED
.
Mengantisipasi penggunaan per region
Cloud Healthcare API mengukur kuota berdasarkan per-Google Cloud-project dan per-region. Kuota biasanya diukur per menit, yang memungkinkan lonjakan kecil permintaan per detik diimbangi pada skala per menit.
Jika Google Cloud project Anda menggunakan beberapa region, Anda dapat menetapkan kuota per region.
Jika set data Cloud Healthcare API Anda berada di lokasi multi-regional us
, dan Anda ingin meminta kuota tambahan, nyatakan dalam permintaan kuota Anda bahwa kuota tersebut adalah untuk "region meta AS". Lokasi multi-regional us
terdiri dari subregion berikut:
us-central1
us-east1
us-west1
Jika Anda sudah memiliki traffic Cloud Healthcare API yang menggunakan kuota di salah satu subregion, pastikan Anda mempertimbangkan traffic yang ada di subregion tersebut saat membuat permintaan penambahan kuota untuk multi-region.us-
us
Misalnya, jika Anda memiliki set data di us-central1
dan us
,
dan Anda meminta penambahan kuota di us
, tentukan dalam permintaan Anda bahwa Anda
memiliki set data di us-central1
.
Lebih memilih transaksi bervolume rendah secara konsisten
Skenario berikut menjelaskan pentingnya mengirimkan volume traffic yang lebih kecil secara konsisten, bukan mengirimkan transaksi bervolume tinggi dengan interval yang lebih lama antar-transaksi.
Volume traffic dihitung menggunakan rumus request payload * time = traffic volume
.
Transaksi volume tinggi adalah satu atau beberapa permintaan ke
Cloud Healthcare API dalam interval singkat yang berisi payload besar.
Serangkaian permintaan juga dapat dianggap sebagai volume tinggi jika ada banyak permintaan yang dikirim dalam interval singkat, terlepas dari ukuran payload.
Misalkan klien mengumpulkan transaksi bervolume tinggi dan mengirimkan transaksi ke Cloud Healthcare API dalam burst setiap lima menit. Hal berikut terjadi:
- Lonjakan traffic awal menggunakan kuota pada menit pertama (bergantung pada pergantian menit) hingga semua kuota habis.
- Traffic lonjakan yang tersisa akan menerima error
429 RESOURCE_EXHAUSTED
. Jika dikonfigurasi, semua permintaan yang terpengaruh akan mengalami backoff eksponensial. - Sebagian persentase permintaan yang mengalami backoff eksponensial awal dijadwalkan ulang untuk dicoba lagi pada menit berikutnya. Beberapa permintaan dicoba beberapa kali dalam satu menit, lalu dicoba lagi pada menit berikutnya.
- Jika volume permintaan cukup tinggi, permintaan yang dicoba ulang mungkin mengalami error
429 RESOURCE_EXHAUSTED
dan backoff eksponensial lagi. Lonjakan traffic tertentu mungkin mengalami backoff eksponensial pada waktu yang berbeda, dan upaya untuk mengirim traffic lagi mungkin bertemu pada menit yang sama di masa mendatang. - Jika volume permintaan masih tinggi, beberapa traffic akan dicoba lagi saat lonjakan traffic berikutnya dimulai. Masalah ini diperparah karena lebih banyak traffic ditambahkan ke backlog permintaan yang ada. Aplikasi Anda mungkin mengalami kesulitan mempertahankan backlog permintaan dan mengirimkannya secara konsisten ke Cloud Healthcare API.
Skenario ini menunjukkan pentingnya mengetahui volume traffic Anda per menit. Terapkan volume traffic dan backoff untuk mencegah kemacetan jaringan dan memastikan aplikasi Anda tidak mengalami banyak kegagalan yang memerlukan percobaan ulang.
Meninjau kuota DICOM dan FHIR
Untuk melihat kuota Cloud Healthcare API yang terkait dengan operasi dan penyimpanan FHIR dan DICOM, lihat Batas kuota.