Memecahkan masalah cluster yang terdaftar di GKE On-Prem API

Halaman ini menunjukkan cara menyelidiki masalah saat membuat cluster pengguna Google Distributed Cloud di konsol Google Cloud .

GKE On-Prem API adalah API yang dihosting Google Cloud yang memungkinkan Anda mengelola siklus proses cluster on-premise menggunakan Terraform dan alatGoogle Cloud standar. GKE On-Prem API berjalan di infrastruktur Google Cloud's. Terraform, konsol Google Cloud , dan Google Cloud CLI adalah klien API, dan menggunakan API untuk membuat, memperbarui, mengupgrade, dan menghapus cluster di pusat data Anda. Jika Anda membuat cluster menggunakan klien standar, cluster akan didaftarkan di GKE On-Prem API, yang berarti Anda dapat menggunakan klien standar untuk mengelola siklus proses cluster (dengan beberapa pengecualian).

Cluster admin tidak ditampilkan di daftar drop-down Dasar-dasar cluster

Cluster admin harus didaftarkan ke fleet sebelum Anda dapat membuat cluster pengguna di konsol Google Cloud . Jika Anda tidak melihat cluster admin di daftar drop-down di bagian Dasar-dasar cluster di konsol Google Cloud , cluster admin tidak terdaftar, atau terdaftar menggunakan perintah gcloud container fleet memberships register. Perintah gcloud ini tidak mendaftarkan cluster admin dengan benar.

Periksa status pendaftaran:

  • Di konsol Google Cloud , buka halaman Kubernetes Engine > Clusters, lalu pilih project Google Cloud yang sama tempat Anda mencoba membuat cluster pengguna.

    Buka halaman cluster GKE

    • Jika cluster admin tidak ditampilkan dalam daftar, lihat Mendaftarkan cluster admin.

    • Jika cluster admin ditampilkan dalam daftar, perilaku ini menunjukkan bahwa cluster didaftarkan menggunakan perintah gcloud container hub memberships register. Perintah gcloud ini tidak mendaftarkan cluster admin dengan benar.

Untuk memperbaiki masalah pendaftaran, selesaikan langkah-langkah berikut:

  1. Hapus keanggotaan fleet cluster admin.

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=global
    
    • ADMIN_CLUSTER_NAME: nama cluster admin.
    • PROJECT_ID: ID project host fleet Anda. Ini adalah project yang Anda pilih saat mencoba membuat cluster pengguna di konsol Google Cloud .
  2. Ikuti langkah-langkah di Mendaftarkan cluster admin untuk mendaftarkan ulang cluster.

Error pembuatan cluster

Bagian ini menjelaskan beberapa error yang terjadi selama pembuatan cluster di konsol Google Cloud .

Error resource sudah ada

Pembuatan cluster pengguna gagal dengan pesan error yang mirip dengan berikut ini:

Resource 'projects/1234567890/[...]/user-cluster1'
already exists
Request ID: 129290123128705826

Pesan error ini menunjukkan bahwa nama cluster sudah digunakan.

Salah satu solusi untuk mengatasi masalah ini adalah dengan menghapus dan membuat ulang cluster:

  1. Hapus cluster.
  2. Buat cluster lagi dengan nama lain yang tidak berkonflik dengan cluster yang ada.

Error grup anti-afinitas

Pembuatan cluster pengguna gagal dengan pesan error yang mirip dengan berikut ini:

- Validation Category: VCenter
    - [FATAL] Hosts for AntiAffinityGroups: Anti-affinity groups enabled with
    available vsphere host number 1 less than 3, please add more vsphere hosts
    or disable anti-affinity groups.

Aturan anti-afinitas VMware Distributed Resource Scheduler (DRS) memerlukan setidaknya 3 host fisik di lingkungan vSphere Anda. Untuk memperbaiki masalah ini, nonaktifkan Grup anti-afinitas di bagian Fitur pada halaman Detail cluster untuk cluster Anda, sebagai berikut:

  1. Di konsol Google Cloud , buka halaman cluster GKE.

    Buka halaman cluster GKE

  2. Pilih project Google Cloud tempat cluster pengguna berada.

  3. Di daftar cluster, klik nama cluster, lalu klik Lihat detail di panel Detail.

  4. Di bagian Fitur, klik Edit.

  5. Hapus opsi Aktifkan grup Anti-afinitas, lalu klik Selesai.

  6. Konsol Google Cloud menampilkan Status cluster: perubahan sedang berlangsung. Klik Tampilkan Detail untuk melihat Kondisi status resource dan Pesan status.

Error alamat IP yang bertentangan

Pembuatan cluster pengguna gagal dengan pesan error yang mirip dengan berikut ini:

- Validation Category: Network Configuration
- [FAILURE] CIDR, VIP and static IP (availability and overlapping): user: user
  cluster control plane VIP "10.251.133.132" overlaps with
  example-cluster1/control plane VIP "10.251.133.132"

Anda tidak dapat mengedit kolom seperti Control plane VIP dan Ingress VIP di bagian Load balancer pada halaman Cluster details di Google Cloud konsol. Untuk memperbaiki alamat IP yang bertentangan, hapus dan buat ulang cluster:

  1. Hapus cluster.
  2. Buat cluster lagi dengan alamat IP yang tidak berkonflik dengan cluster yang ada.

Menghapus cluster yang tidak responsif

Cluster dapat berada dalam kondisi tidak sehat karena berbagai alasan, seperti:

  • Masalah konektivitas dengan Connect Agent atau lingkungan lokal.
  • Cluster admin untuk cluster pengguna dihapus, atau ada masalah konektivitas antara cluster admin dan pengguna.
  • VM cluster dihapus sebelum cluster dihapus.

Jika konsol tidak dapat menghapus cluster, gunakan perintah gcloud CLI untuk menghapus resource dari cluster yang tidak sehat. Google Cloud Jika Anda belum mengupdate gcloud CLI baru-baru ini, jalankan perintah berikut untuk mengupdate komponen:

gcloud components update

Selanjutnya, hapus resource Google Cloud .

Cluster pengguna

  1. Hapus cluster pengguna:

    gcloud container vmware clusters delete USER_CLUSTER_NAME \
      --project=PROJECT_ID \
      --location=REGION \
      --force \
      --allow-missing \
      --ignore-errors

    Ganti kode berikut:

    • USER_CLUSTER_NAME: Nama cluster pengguna yang akan dihapus.

    • PROJECT_ID: ID project tempat cluster terdaftar.

    • REGION: Google Cloud Lokasi yang terkait dengan cluster pengguna. Lokasi ditampilkan di konsol.

      Flag --force menghapus cluster yang memiliki node pool. Tanpa tanda --force, Anda harus menghapus kumpulan node terlebih dahulu, lalu menghapus cluster.

      Flag --allow-missing memungkinkan perintah dilanjutkan jika cluster tidak ditemukan.

      Flag --ignore-errors menghapus Google Cloud resource saat cluster admin dan pengguna tidak dapat dijangkau. Beberapa resource F5 atau vSphere mungkin tersisa. Lihat Membersihkan resource untuk mengetahui informasi tentang cara membersihkan resource yang tersisa.

      Perintah ini akan menghapus cluster jika ada dan menghapus resource GKE On-Prem API dan keanggotaan fleet dari Google Cloud.

  2. Konfirmasi bahwa resource GKE On-Prem API telah dihapus:

    gcloud container vmware clusters list \
      --project=PROJECT_ID \
      --location=-

    Jika Anda menetapkan --location=-, artinya mencantumkan semua cluster di semua wilayah. Jika Anda perlu mempersempit daftar, tetapkan --location ke region tertentu.

  3. Pastikan bahwa resource keanggotaan fleet telah dihapus:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

Cluster admin

  1. Jika Anda mendaftarkan cluster admin di GKE On-Prem API, batalkan pendaftarannya:

    gcloud container vmware admin-clusters unenroll ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=REGION \
     --allow-missing 
    

    Ganti kode berikut:

    • ADMIN_CLUSTER_NAME: Nama cluster admin.
    • PROJECT_ID: ID project host fleet.
    • REGION: Google Cloud Region.

    Flag --allow-missing membatalkan pendaftaran cluster jika keanggotaan fleet tidak ditemukan.

    Perintah ini menghapus resource GKE On-Prem API dari Google Cloud.

  2. Hapus cluster dari fleet:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME \
     --project=PROJECT_ID \
     --location=global

    Perintah ini menghapus resource keanggotaan fleet dari Google Cloud.

  3. Konfirmasi bahwa resource GKE On-Prem API telah dihapus:

    gcloud container fleet memberships delete ADMIN_CLUSTER_NAME --project=FLEET_HOST_PROJECT_ID
    

    Jika Anda menetapkan --location=-, artinya mencantumkan semua cluster di semua wilayah. Jika Anda perlu mempersempit daftar, tetapkan --location ke region tertentu.

  4. Pastikan bahwa resource keanggotaan fleet telah dihapus:

    gcloud container fleet memberships list \
      --project=PROJECT_ID

Langkah berikutnya

Jika Anda memerlukan bantuan tambahan, hubungi Cloud Customer Care.

Anda juga dapat melihat bagian Mendapatkan dukungan untuk mengetahui informasi selengkapnya tentang sumber dukungan, termasuk yang berikut:

  • Persyaratan untuk membuka kasus dukungan.
  • Alat untuk membantu Anda memecahkan masalah, seperti log dan metrik.
  • Komponen yang didukung, versi, dan fitur Google Distributed Cloud untuk VMware (khusus software).