Pengantar pemecahan masalah Cloud Run

Halaman ini menjelaskan strategi pemecahan masalah umum untuk error Cloud Run. Personalized Service Health memublikasikan semua insiden Cloud Run yang berasal dari infrastruktur Google Cloud yang mendasarinya untuk mengidentifikasi gangguan layanan Google Cloud yang memengaruhi project Anda. Anda juga harus mempertimbangkan penyiapan pemberitahuan tentang peristiwa Personalized Service Health. Untuk mengetahui informasi tentang insiden yang memengaruhi semua Google Cloud layanan, lihat dasbor Google Cloud Service Health.

Lihat bagian berikut dalam panduan pemecahan masalah Cloud Run untuk menyelesaikan masalah terkait resource Cloud Run Anda:

Strategi pemecahan masalah Cloud Run

Bagian berikut menjelaskan cara menerapkan strategi pemecahan masalah umum untuk mengatasi error. Jika Anda terus mengalami error bahkan setelah mengikuti langkah-langkah dalam panduan pemecahan masalah, lihat Langkah berikutnya.

Menghasilkan log yang baik menggunakan Cloud Logging

Pemecahan masalah resource Cloud Run Anda akan lebih mudah jika Anda memiliki log yang baik untuk proses debug. Anda harus menulis log sedemikian rupa sehingga menghubungkan log penampung Anda dengan log permintaan.

Dengan log yang dikorelasikan, Anda dapat mengidentifikasi permintaan yang memerlukan analisis lebih lanjut, menemukan rekaman aktivitas permintaan, dan menganalisis penyebab utama masalah. Untuk mengetahui informasi selengkapnya tentang cara menulis log, lihat Menulis log penampung.

Menyelidiki instance menggunakan Logs Explorer

Setiap log permintaan di Cloud Run berisi kolom instanceId yang mengidentifikasi instance yang menangani permintaan Anda. Bergantung pada nilai konkurensi yang Anda tentukan, satu instance dapat menangani beberapa permintaan secara bersamaan.

Jika Anda memiliki beberapa instance yang memancarkan log secara bersamaan, Anda harus memfilter instance untuk mengidentifikasi permintaan berurutan yang menyebabkan instance mengalami error.

Memfilter instance memungkinkan Anda men-debug masalah performa tertentu yang terkait dengan cold start atau peningkatan latensi. Masalah ini juga dapat terikat pada variabel yang dideklarasikan dalam cakupan global, saat nilai digunakan kembali dalam permintaan serentak berikutnya. Contohnya adalah saat Anda membuat objek global kumpulan koneksi tunggal untuk instance, lalu menggunakannya dalam beberapa permintaan.

Untuk memfilter instance tertentu di Logs Explorer, ikuti langkah-langkah berikut:

  1. Di konsol Google Cloud , buka halaman Logs Explorer:

    Buka Logs Explorer

  2. Pilih project yang sudah ada di bagian atas halaman, atau buat project baru. Google Cloud

  3. Pilih resource Revisi Cloud Run untuk layanan, atau Tugas Cloud Run untuk tugas.

  4. Luaskan entri log untuk memfilter menurut instance tertentu.

  5. Klik nilai ID instance, lalu pilih Show matching entries.

Saat menyelidiki instance, Anda dapat menggunakan Investigasi Gemini Cloud Assist untuk mendapatkan insight tambahan tentang log Anda. Untuk mengetahui informasi selengkapnya tentang berbagai cara untuk memulai penyelidikan menggunakan Logs Explorer, lihat Memecahkan masalah dengan Penyelidikan Gemini Cloud Assist dalam dokumentasi Gemini.

Mengatasi latensi permintaan yang tidak terduga

Jika Anda mengalami masalah latensi, lakukan hal berikut:

  1. Periksa apakah latensi memengaruhi semua permintaan ke resource Cloud Run Anda atau hanya sebagian kecil. Cloud Run terintegrasi secara otomatis dengan Cloud Monitoring tanpa memerlukan penyiapan atau konfigurasi.

    Untuk melihat metrik latensi permintaan individual, ikuti langkah-langkah berikut:

    1. Di konsol Google Cloud , buka halaman Cloud Run:

      Buka Cloud Run

    2. Pilih layanan atau tugas dari daftar.

    3. Klik tab METRIK untuk menampilkan dasbor Latensi permintaan.

    Untuk melihat metrik latensi di Cloud Monitoring, pilih dari daftar Metrics, Cloud Run Revision > Request_latencies > Request latency.

    Untuk mengetahui daftar semua metrik Cloud Run yang tersedia dan detail yang lebih mendalam, lihat metrikGoogle Cloud di Cloud Monitoring.

  2. Identifikasi permintaan dengan latensi tinggi untuk memahami sumber latensi. Anda dapat menggunakan Cloud Trace atau Cloud Logging untuk memahami durasi permintaan tertentu.

    Untuk mengidentifikasi permintaan dengan latensi tinggi menggunakan Cloud Logging, terapkan filter traceSampled=true untuk menghubungkan log di Cloud Logging dengan rekaman aktivitas di Cloud Trace. Untuk mengetahui informasi selengkapnya, lihat Mengintegrasikan dengan Cloud Logging.

    Terkadang, dependensi seperti permintaan ke layanan lain dapat menyebabkan masalah latensi. Untuk mengidentifikasi permintaan tersebut, Anda harus memiliki penargetan logging eksplisit untuk permintaan tersebut. Jika Anda tidak menghasilkan log tersebut, hal ini dapat muncul sebagai masalah latensi yang berasal dari layanan Cloud Run.

    Selain itu, Anda harus mempertimbangkan untuk mengevaluasi lonjakan latensi dalam konteks jangka waktu yang dipilih. Signifikansi lonjakan bersifat relatif; lonjakan besar dalam jendela kecil mungkin tidak signifikan dalam jendela yang lebih besar, dan sebaliknya. Oleh karena itu, periode waktu sangat memengaruhi interpretasi data latensi.

  3. Coba tingkatkan jumlah instance minimum untuk mengurangi latensi permintaan masuk, dan hindari cold start. Anda juga harus mempertimbangkan untuk mengubah kode sumber, dan menyesuaikan setelan penskalaan untuk membatasi jumlah koneksi ke layanan pendukung.

    Untuk mengetahui informasi selengkapnya, lihat Mengoptimalkan performa.

Memecahkan masalah dengan bantuan Gemini

Anda dapat menggunakan chat Gemini Cloud Assist untuk menganalisis log dan memecahkan masalah error. Dengan bantuan Gemini, Anda dapat dengan cepat mengidentifikasi dan menyelesaikan error dengan memanfaatkan kemampuan analisis log alat ini, sehingga menghemat waktu dan tenaga yang berharga.

Untuk menggunakan Gemini Cloud Assist dari Google Cloud konsol, lakukan hal berikut:

  1. Pastikan Gemini Cloud Assist disiapkan untuk Google Cloud akun pengguna dan project Anda.

  2. Siapkan lingkungan pengembangan Cloud Run di project Google Cloud Anda dan pastikan Anda memiliki izin deployment yang sesuai.

  3. Buka halaman Cloud Run di Google Cloud konsol.

    Buka Cloud Run

  4. Di toolbar konsol, pilih project Google Cloud . Gunakan project yang terkait dengan project ID yang Anda kirimkan setelah Anda diberi akses ke Gemini Cloud Assist.

  5. Klik spark Open or close Gemini AI chat.

    Panel Gemini akan terbuka.

  6. Jika perlu, klik Setuju jika Anda menyetujui persyaratan.

  7. Jika Anda memiliki pertanyaan tentang aplikasi tertentu, berikan konteks dengan membuka halaman yang menampilkan resource Anda sebelum mengajukan pertanyaan. Saat membuat respons, Gemini menyertakan informasi tentang halaman dan project konsol saat ini.

  8. Masukkan perintah di panel Gemini.

    Tabel berikut memberikan beberapa contoh perintah untuk menggunakan Gemini Cloud Assist dengan Cloud Run.

    Perintah Jenis respons
    "Dapatkah Anda menjelaskan pesan error yang saya lihat di log container Cloud Run?" Tanpa pesan error tertentu dalam perintah, output akan memberikan panduan pemecahan masalah untuk pesan error log penampung Cloud Run yang umum.
    "Dapatkah Anda menjelaskan pesan error yang saya lihat di log untuk layanan Cloud Run saya?

    HTTP 429 The request was aborted because there was no available instance. The Cloud Run service might have reached its maximum container instance limit or the service was otherwise not able to scale to incoming requests. This might be caused by a sudden increase in traffic, a long container startup time or a long request processing time."
    Penjelasan tentang pesan error Cloud Run dan cara mengatasi error tersebut.
    "Bagaimana cara memperbaiki pesan error berikut saat men-deploy layanan Cloud Run saya?

    HTTP 404: Not found
    Penyebab umum error dan cara memecahkan masalah error.
    "Layanan Cloud Run saya terus mengalami error. Apa yang mungkin menyebabkan hal ini?" Pendekatan untuk menyelidiki penyebab dan cara mengatasi masalah.
    "Bagaimana cara mengetahui apakah error 5XX yang muncul di log disebabkan oleh gangguan layanan infrastruktur Google?" Langkah-langkah untuk menentukan penyebab error 5XX.
    "Bagaimana cara mengidentifikasi penyebab error ini: com.google.apps.framework.request.BadRequestException Project PROJECT has serving status SYSTEM_DISABLED and cannot be modified?" Menunjukkan bahwa Google Cloud project telah dinonaktifkan secara administratif di tingkat sistem. Memberikan langkah-langkah untuk menyelidiki penyebabnya lebih lanjut.
    "Mengapa saya dapat mengakses layanan Cloud Run dari browser jika saya telah menyetel ingress=internal?" Penjelasan tentang perilaku yang diharapkan saat mengonfigurasi setelan ingress ke internal. Mencakup skenario lain saat akses mungkin tampak berfungsi dari browser Anda.

Untuk mengetahui detail selengkapnya, lihat referensi berikut:

Menggunakan Investigasi Gemini Cloud Assist

Selain percakapan interaktif, Gemini Cloud Assist dapat melakukan analisis mendalam yang lebih otomatis melalui Investigasi Gemini Cloud Assist. Fitur ini terintegrasi langsung ke dalam alur kerja seperti Logs Explorer, dan merupakan alat analisis akar penyebab yang efektif.

Saat Anda memulai penyelidikan dari error atau resource tertentu, Gemini Cloud Assist menganalisis log, konfigurasi, dan metrik. Alat ini menggunakan data ini untuk menghasilkan pengamatan dan hipotesis yang diberi peringkat tentang kemungkinan penyebab utama, lalu memberikan langkah selanjutnya yang direkomendasikan kepada Anda. Anda juga dapat mentransfer hasil ini ke kasus dukungan Google Cloud untuk memberikan konteks berharga yang dapat membantu Anda menyelesaikan masalah lebih cepat.

Untuk mengetahui informasi selengkapnya tentang berbagai cara untuk memulai penyelidikan, lihat Memecahkan masalah dengan Penyelidikan Gemini Cloud Assist dalam dokumentasi Gemini.

Langkah berikutnya

Jika Anda tidak dapat menemukan solusi untuk masalah Anda dalam dokumentasi Cloud Run, ikuti langkah-langkah berikut: