Mengonfigurasi layanan Cloud Run

Halaman ini memberikan ringkasan opsi konfigurasi untuk layanan Cloud Run.

Menghindari cold start dan mengurangi latensi

Anda dapat menghindari cold start untuk aplikasi dan mengurangi latensi aplikasi dengan menetapkan jumlah minimum instance. Perhatikan bahwa penetapan jumlah minimum instance akan dikenakan biaya. Lihat Menetapkan instance minimum untuk layanan untuk mempelajari lebih lanjut.

Kapasitas

Anda dapat mengontrol jumlah memori, CPU, dan serentak maksimum yang dapat digunakan layanan.

Gunakan setelan penagihan untuk mengontrol cara Anda ditagih, baik per permintaan dan hanya saat instance memproses permintaan, atau untuk seluruh siklus proses instance.

Variabel lingkungan

Anda dapat membuat pasangan nilai kunci untuk digunakan dengan layanan Cloud Run. Lihat Mengonfigurasi variabel lingkungan untuk layanan untuk mempelajari lebih lanjut.

Lingkungan eksekusi

Cloud Run memiliki dua lingkungan eksekusi. Pelajari perbedaan antara kedua lingkungan eksekusi

GPU

Jika perlu menghosting beban kerja AI, seperti model inferensi dan pelatihan model, Anda dapat mengonfigurasi layanan Cloud Run dengan atau tanpa GPU.

Melindungi dari level permintaan yang tinggi

Anda dapat mengontrol jumlah instance yang dibuat oleh layanan Cloud Run untuk melayani permintaan dengan menetapkan instance maksimum dan instance minimum. Hal ini dapat membantu menekan biaya dan mencegah tingkat permintaan tinggi yang tidak normal.

Health check

Cloud Run memungkinkan Anda mengonfigurasi dua jenis probe health check. Salah satu pemeriksaan menentukan kapan penampung siap menerima traffic, dan pemeriksaan lainnya menentukan apakah akan memulai ulang penampung. Pelajari lebih lanjut health check penampung.

Penskalaan

Secara default, Cloud Run akan otomatis menskalakan ke jumlah maksimum instance yang ditentukan atau default, bergantung pada traffic dan penggunaan CPU. Namun, untuk beberapa kasus penggunaan, Anda mungkin menginginkan kemampuan untuk menetapkan jumlah instance tertentu, menggunakan penskalaan manual.

Rahasia

Anda dapat menggunakan Secret Manager dengan Cloud Run untuk menyimpan kunci API, sandi, dan informasi sensitif lainnya dengan aman. Lihat Mengonfigurasi secret untuk mempelajari lebih lanjut.

Service identity

Identitas layanan Cloud Run adalah akun layanan yang digunakan sebagai akun yang diautentikasi untuk mengakses Google Cloud API dari penampung instance Cloud Run Anda. Sebaiknya Anda membuat akun layanan dan menentukan kumpulan izin minimal yang diperlukan akun layanan untuk mengakses resource Google Cloud tertentu.

Waktu tunggu

Anda dapat menetapkan waktu tunggu permintaan Cloud Run yang menentukan waktu saat respons harus ditampilkan.

Rekomendasi

Lihat Mengoptimalkan dengan Recommender untuk mempelajari pengoptimalan yang disediakan oleh Recommender di Cloud Run.

Pemisahan traffic

Setiap kali Anda men-deploy atau men-deploy ulang layanan, revisi baru dari layanan Cloud Run yang mendasarinya akan otomatis dibuat. Lihat Afinitas sesi dan pemisahan traffic untuk mengetahui detail selengkapnya.

Layanan tag

Tag adalah pasangan nilai kunci yang dapat Anda terapkan ke resource untuk kontrol akses yang terperinci menggunakan konsol Cloud Run.

Administrator tag membuat tag untuk resource di seluruh Google Cloud pada level organisasi atau project. Tag menyediakan cara untuk mengizinkan atau menolak kebijakan secara bersyarat berdasarkan apakah resource memiliki tag tertentu. Untuk mempelajari lebih lanjut, lihat Memberi tag pada layanan.

Pemasangan volume

Pemasangan volume Cloud Run memungkinkan Anda mengakses data bersama yang disimpan di sistem file lokal, seperti bucket penyimpanan atau konten server file, dari penampung. Anda dapat memasang bucket Cloud Storage, share NFS seperti instance Filestore, sistem file dalam memori yang disediakan oleh Cloud Run, atau sistem file jaringan NDB, 9P, CIFS/Samba, dan Ceph.