Memecahkan masalah GKE


Halaman ini mencantumkan halaman pemecahan masalah untuk masalah umum yang mungkin Anda alami saat menggunakan Google Kubernetes Engine (GKE). Halaman ini ditujukan untuk Admin dan arsitek, Spesialis keamanan, Spesialis jaringan, atau Spesialis penyimpanan yang memecahkan masalah konfigurasi GKE. Untuk mempelajari peran GKE lebih lanjut, lihat Peran dan tugas pengguna GKE Enterprise umum.

Jika Anda baru mengenal pemecahan masalah di GKE atau ingin mendapatkan ringkasan tingkat tinggi tentang alat dan teknik dasar, mulailah dengan Pengantar pemecahan masalah.

Untuk mendiagnosis dan menyelesaikan masalah yang Anda alami di berbagai tahap saat bekerja dengan infrastruktur GKE, lihat bagian berikut:

Halaman ini juga memberikan akses ke topik pemecahan masalah yang lebih umum:

Untuk memecahkan masalah jaringan GKE, lihat Memecahkan masalah jaringan GKE dalam dokumentasi jaringan GKE.

Pengantar pemecahan masalah

Topik Deskripsi
Pengantar pemecahan masalah GKE Mulai pemecahan masalah GKE dengan mempelajari cara menggunakan alat inti untuk mendiagnosis dan menyelesaikan masalah Anda.

Penyiapan cluster

Topik Deskripsi
Pembuatan cluster Menyelesaikan masalah saat membuat cluster.
Cluster Autopilot Mendiagnosis dan memecahkan masalah cluster GKE Autopilot, termasuk pembuatan cluster, penghapusan namespace, penskalaan, dan masalah workload.
Alat command line Kubectl Memecahkan masalah alat command line kubectl di GKE, termasuk masalah autentikasi, otorisasi. Halaman ini juga menyertakan saran tentang cara memecahkan masalah proxy Konnectivity untuk memeriksa apakah proxy tersebut menyebabkan perintah kubectl logs, attach, exec, atau port-forward berhenti merespons.
Node pool standar Memecahkan masalah node pool GKE Standard, termasuk masalah pada pembuatan node pool, penyediaan upaya terbaik, metadata instance yang rusak, dan memigrasikan workload ke node pool baru.
Pendaftaran node Memecahkan masalah yang terjadi saat menambahkan node ke cluster GKE Standard, seperti kegagalan pendaftaran node dan prasyarat yang tidak terpenuhi untuk keberhasilan pendaftaran node.
Runtime container Memecahkan masalah runtime container di GKE, termasuk masalah pada containerd dan dockershim, serta registri pribadi.

Penyimpanan

Topik Deskripsi
Penyimpanan Memecahkan masalah penyimpanan, termasuk masalah terkait persistent disk regional, performa disk, dan perluasan volume.

Keamanan cluster

Topik Deskripsi
Authentication Memecahkan masalah autentikasi di GKE, termasuk masalah dengan RBAC, Workload Identity Federation for GKE, dan server metadata GKE.
Akun layanan Memecahkan masalah akun layanan, termasuk memulihkan akun layanan default dan mengaktifkan akun layanan default Compute Engine.
Rahasia lapisan aplikasi Memecahkan masalah yang dapat terjadi saat mengonfigurasi enkripsi secret lapisan aplikasi, termasuk kegagalan update dan error saat Anda tidak dapat menggunakan kunci Cloud KMS atau saat versi kunci Cloud KMS dihancurkan.

Root Certificate Authority Cluster akan segera habis masa berlakunya

Topik Deskripsi
Masa berlaku Otoritas Sertifikat (CA) Root akan segera berakhir Jika Certificate Authority (CA) root cluster Anda akan segera berakhir, pelajari cara melakukan rotasi kredensial untuk mencegah terganggunya operasi cluster normal.

Beban kerja

Topik Deskripsi
Workload yang di-deploy Memecahkan masalah error untuk beban kerja yang berjalan di cluster GKE, termasuk CrashLoopBackOff dan PodUnschedulable. Baca bagian Pod Tidak Dapat Dijadwalkan untuk mendapatkan saran tentang error seperti MatchNodeSelector dan Does not have minimum availability.
Penarikan gambar Memecahkan masalah penarikan image. Pelajari penyebab status seperti ImagePullBackOff dan ErrImagePull serta cara menyelesaikan status ini dengan memperbaiki masalah umum seperti autentikasi dan konektivitas jaringan.
Peristiwa OOM Memecahkan masalah peristiwa Kehabisan Memori (OOM) Kubernetes. Mengidentifikasi penyebab, membedakan jenis peristiwa, dan menerapkan solusi yang efektif untuk penghentian paksa karena kehabisan memori (OOM) di tingkat container dan node.
Workload Arm Memecahkan masalah terkait workload Arm, termasuk Pod yang mengalami error di node Arm.
TPU Memecahkan masalah TPU, termasuk masalah terkait kuota, penyediaan otomatis node, konfigurasi workload, dan penjadwalan.
GPU Memecahkan masalah GPU, termasuk masalah penginstalan driver GPU, error plugin perangkat, dan image container.

Pengelolaan cluster

Topik Deskripsi
Upgrade Memecahkan masalah terkait upgrade cluster GKE, seperti kube-apiserver yang tidak sehat setelah upgrade bidang kontrol atau workload yang dikeluarkan setelah upgrade.
Webhook Pahami cara memecahkan masalah dan memastikan stabilitas bidang kontrol cluster Anda saat menggunakan webhook penerimaan.
Namespace terjebak dalam status Terminating Pecahkan masalah terkait namespace yang terjebak dalam status Terminating dengan mengidentifikasi dan menghapus komponen tidak responsif yang memblokir penghapusan.

Pemantauan

Topik Deskripsi
Metrik sistem Memecahkan masalah metrik sistem yang tidak muncul di Cloud Monitoring.
Dasbor pemantauan Memecahkan masalah dasbor pemantauan, termasuk masalah saat mengaktifkan pemantauan, resource Kubernetes yang tidak ada, dan izin.
Logging Memecahkan masalah logging, termasuk masalah terkait pengaktifan logging, log yang tidak ada, dan kuota.

Error 4xx

Topik Deskripsi
Error 4xx Pecahkan masalah beberapa error 400, 401, 403, dan 404 yang mungkin Anda temui saat menggunakan GKE. Halaman ini juga berisi informasi tentang cara memecahkan masalah error izin edit yang tidak ada di akun.

Masalah umum

Topik Deskripsi
Masalah umum Identifikasi dan selesaikan masalah umum yang mungkin memengaruhi penggunaan GKE Anda.

Langkah berikutnya