Metriche di utilizzo delle risorse del parco risorse

Questa pagina approfondisce le metriche di utilizzo delle risorse del parco risorse e del team, spiegando come vengono calcolate e fornendo suggerimenti su come utilizzarle per ottimizzare l'utilizzo delle risorse.

Puoi visualizzare queste metriche nelle seguenti dashboard:

Queste metriche descrivono l'efficienza con cui i tuoi cluster utilizzano le risorse fisicamente disponibili che paghi o quelle che assegni sull'hardware on-premise. Puoi utilizzare queste informazioni per comprendere l'efficacia dell'utilizzo delle risorse su larga scala, a livello di parco o di team. In questo modo, puoi ottimizzare le dimensioni del cluster e l'allocazione delle risorse tra i cluster e gli spazi dei nomi oppure ottimizzare il modo in cui i team di applicazioni richiedono e prenotano le risorse.

Utilizzare le metriche di utilizzo delle risorse

I seguenti suggerimenti possono aiutarti a utilizzare le metriche nella console per identificare e risolvere i problemi:

  • Se l'utilizzo totale della CPU/della memoria/del disco del tuo parco risorse indica un utilizzo inaspettatamente elevato o ridotto negli ultimi sette giorni, controlla sempre il grafico Utilizzo della CPU/della memoria/del disco per parco risorse corrispondente per valutare se l'utilizzo inaspettato è costante o causato da picchi di utilizzo.
  • Se Utilizzo CPU/memoria/disco principale per cluster indica singoli cluster che si comportano in modo diverso rispetto agli altri, valuta la possibilità di esaminare più da vicino questi particolari cluster. Valuta la possibilità di ridimensionare i cluster.
  • Se Utilizzo massimo di CPU/memoria/disco per spazio dei nomi mostra un picco imprevisto negli ultimi sette giorni, valuta la possibilità che sia un determinato carico di lavoro a causarlo. Una possibile soluzione potrebbe essere quella di ridistribuire i carichi di lavoro tra le risorse.
  • Utilizzo CPU/memoria/disco per parco risorse ti consente di osservare il rapporto tra le risorse utilizzate e quelle richieste. Una grande differenza tra i due potrebbe indicare che i team di applicazioni stanno richiedendo e riservando troppe risorse.

Informazioni sulle metriche di utilizzo delle risorse

Le seguenti metriche sono fornite nelle dashboard di panoramica dell'ambito di GKE Enterprise, del parco risorse e del team, calcolate utilizzando le informazioni di Cloud Monitoring sui cluster del parco risorse.

Puoi visualizzare le metriche a livello di parco risorse nelle dashboard di panoramica di GKE Enterprise e del parco risorse. Le metriche a livello di team sono disponibili nelle dashboard di panoramica di GKE Enterprise e del team.

Metriche della CPU

  • Utilizzo CPU totale:
    • Per le metriche a livello di parco risorse, una media di tutti i punti nel tempo per un determinato intervallo di tempo, dove il punto nel tempo è un rapporto tra le risorse allocabili e quelle utilizzate in tutti i cluster registrati in un parco risorse.
      • Allocabile: la quantità di CPU allocata a tutti i nodi di tutti i cluster registrati in un parco risorse. Calcolata in base alla metrica node/cpu/allocatable_cores.
      • Utilizzata: la quantità di CPU utilizzata da tutti i container in tutti i cluster registrati a un parco risorse. Calcolata in base alla metrica container/cpu/core_usage_time.
    • Per la dashboard Monitoraggio del team, una media di tutti i punti nel tempo per una determinata finestra temporale, dove il punto nel tempo è un rapporto tra risorse richieste e utilizzate in tutti gli spazi dei nomi associati a un ambito del team.
      • Richiesta: la quantità di CPU richiesta da tutti i container in tutti gli spazi dei nomi associati a un ambito del team. Calcolata in base alla metrica container/cpu/request_cores.
      • Utilizzata: la quantità di CPU utilizzata da tutti i container in tutti gli spazi dei nomi associati a un ambito di gruppo. Calcolata dalla metrica container/cpu/core_usage_time.
  • Utilizzo della CPU per flotta/team:
    • A livello di parco risorse, la relazione tra le risorse utilizzate, richieste e allocate.
      • Utilizzata: la quantità di CPU utilizzata da tutti i container in tutti i cluster registrati a un parco risorse. Calcolata in base alla metrica container/cpu/core_usage_time.
      • Richiesta: la quantità di CPU richiesta da tutti i container in tutti i cluster registrati a un parco risorse. Calcolata dalla metrica container/cpu/request_cores.
      • Allocabile: la quantità di CPU allocata a tutti i nodi di tutti i cluster registrati in un parco risorse. Calcolata in base alla metrica node/cpu/allocatable_cores.
    • A livello di team, la relazione tra il limite di risorse e le risorse utilizzate e richieste.
      • Utilizzata: la quantità di CPU utilizzata da tutti i container in tutti gli spazi dei nomi associati a un ambito di gruppo. Calcolata dalla metrica container/cpu/core_usage_time.
      • Richiesta: la quantità di CPU richiesta da tutti i container in tutti gli spazi dei nomi associati a un ambito del team. Calcolata in base alla metrica container/cpu/request_cores.
      • Limite: la quantità massima di CPU disponibile per tutti i container in tutti gli spazi dei nomi associati a un ambito del team. Calcolata in base alla metrica container/cpu/limit_cores.
  • Utilizzo CPU principale per cluster: elenco di cluster ordinato in base alla media di tutti i punti nel tempo per un determinato intervallo di tempo, dove il punto nel tempo è un rapporto tra le risorse allocabili e quelle utilizzate per un determinato cluster.
  • Utilizzo massimo della CPU per spazio dei nomi: elenco di spazi dei nomi ordinati in base alla media di tutti i punti in tempo per un determinato intervallo di tempo, dove il punto in tempo è un rapporto tra le risorse utilizzate e richieste per un determinato spazio dei nomi.
    • Utilizzata: la quantità di CPU utilizzata da tutti i container in uno spazio dei nomi. Calcolata in base alla metrica container/cpu/core_usage_time.
    • Richiesta: la quantità di CPU richiesta da tutti i container in uno spazio dei nomi. Calcolata in base alla metrica container/cpu/request_cores.

Metriche di memoria

  • Utilizzo memoria totale:
    • Per le metriche a livello di parco risorse, si fa riferimento a una media di tutti i punti in un determinato intervallo di tempo, dove il punto in un determinato intervallo di tempo è un rapporto tra le risorse allocabili e quelle utilizzate in tutti i cluster che appartengono a un parco risorse.
      • Allocabile: la quantità di memoria allocata a tutti i nodi di tutti i cluster registrati in un parco risorse. Calcolata dalla metrica node/memory/allocatable_byte.
      • Utilizzata: la quantità di memoria non eseguibile utilizzata da tutti i container in tutti i cluster registrati in un parco risorse. Calcolata in base alla metrica container/memory/used_bytes.
    • Per le metriche a livello di team, si riferisce a una media di tutti i punti in un determinato intervallo di tempo, dove il punto in un determinato intervallo di tempo è un rapporto tra le risorse richieste e quelle utilizzate in tutti gli spazi dei nomi che appartengono a un ambito del team.
      • Richiesta: la quantità di memoria richiesta da tutti i container in tutti gli spazi dei nomi associati a un ambito. Calcolata in base alla metrica container/memory/request_bytes.
      • Utilizzata: la quantità di memoria non eseguibile utilizzata da tutti i container in tutti gli spazi dei nomi associati a un ambito. Calcolata in base alla metrica container/memory/used_bytes.
  • Utilizzo della memoria per parco risorse/team:
    • A livello di parco risorse, la relazione tra le risorse utilizzate, richieste e allocate.
      • Utilizzata: la quantità di memoria non eseguibile utilizzata da tutti i container in tutti i cluster registrati in un parco risorse. Calcolata in base alla metrica container/memory/used_bytes.
      • Richiesta: la quantità di memoria richiesta da tutti i container in tutti i cluster registrati a un parco risorse. Calcolata dalla metrica container/memory/request_bytes.
      • Allocabile: la quantità di memoria allocata a tutti i nodi di tutti i cluster registrati in un parco risorse. Calcolata dalla metrica node/memory/allocatable_byte.
    • A livello di team, la relazione tra il limite di risorse e le risorse utilizzate e richieste.
      • Utilizzata: la quantità di memoria non eseguibile utilizzata da tutti i container in tutti gli spazi dei nomi associati a un ambito. Calcolata in base alla metrica container/memory/used_bytes.
      • Richiesta: la quantità di memoria richiesta da tutti i container in tutti gli spazi dei nomi associati a un ambito. Calcolata in base alla metrica container/memory/request_bytes.
      • Limite: la quantità massima di memoria disponibile per tutti i container in tutti gli spazi dei nomi associati a un ambito. Calcolata in base alla metrica container/memory/limit_bytes.
  • Utilizzo massimo della memoria per cluster: elenco di cluster ordinato in base alla media di tutti i punti in tempo per una determinata finestra temporale, dove il punto in tempo è un rapporto tra le risorse allocabili e quelle utilizzate per un determinato cluster.
    • Allocabile: la quantità di memoria allocata a tutti i nodi di un cluster. Calcolata in base alla metrica node/memory/allocatable_byte.
    • Utilizzata: la quantità di memoria non eseguibile utilizzata da tutti i container in un cluster. Calcolata in base alla metrica container/memory/used_bytes.
  • Utilizzo massimo della memoria per spazio dei nomi: elenco di spazi dei nomi ordinati in base a una media di tutti i punti nel tempo per una determinata finestra temporale, dove il punto nel tempo è un rapporto tra le risorse utilizzate e richieste per un determinato spazio dei nomi.
    • Utilizzata: la quantità di memoria non eseguibile utilizzata da tutti i container in uno spazio dei nomi. Calcolata in base alla metrica container/memory/used_bytes.
    • Richiesta: la quantità di memoria richiesta da tutti i container in uno spazio dei nomi. Calcolata in base alla metrica container/memory/request_bytes.

Metriche dei dischi

  • Utilizzo totale del disco:
    • Per le metriche a livello di parco risorse, si riferisce a una media di tutti i punti nel tempo per un determinato intervallo di tempo, dove il punto nel tempo è un rapporto tra le risorse allocabili e quelle utilizzate in tutti i cluster che appartengono a un parco risorse.
      • Allocabile: la quantità di spazio di archiviazione temporanea locale allocata a tutti i nodi di tutti i cluster registrati in un parco risorse. Calcolata in base alla metrica node/ephemeral_storage/allocatable_bytes.
      • Utilizzato: la quantità di spazio di archiviazione temporanea locale utilizzata da tutti i container di tutti i cluster registrati a un parco. Calcolata in base alla metrica container/ephemeral_storage/used_bytes.
    • Per le metriche a livello di team, si riferisce a una media di tutti i punti in un determinato intervallo di tempo, dove il punto in un determinato intervallo di tempo è un rapporto tra le risorse richieste e quelle utilizzate in tutti gli spazi dei nomi che appartengono a un ambito del team.
      • Richiesta: la quantità di spazio di archiviazione temporaneo locale richiesta da tutti i container in tutti gli spazi dei nomi associati a un ambito. Calcolata in base alla metrica container/ephemeral_storage/request_bytes.
      • Utilizzato: la quantità di spazio di archiviazione temporanea locale utilizzata da tutti i container in tutti gli spazi dei nomi associati a un ambito. Calcolata in base alla metrica container/ephemeral_storage/used_bytes.
  • Utilizzo del disco per parco risorse/team:
    • A livello di parco risorse, la relazione tra le risorse utilizzate, richieste e allocate.
      • Utilizzato: la quantità di spazio di archiviazione temporanea locale utilizzata da tutti i container di tutti i cluster registrati a un parco. Calcolata in base alla metrica container/ephemeral_storage/used_bytes.
      • Richiesta: la quantità di spazio di archiviazione temporaneo locale richiesta da tutti i container in tutti i cluster registrati a un parco. Calcolata in base alla metrica container/ephemeral_storage/request_bytes.
      • Allocabile: la quantità di spazio di archiviazione temporanea locale allocata a tutti i nodi di tutti i cluster registrati in un parco risorse. Calcolata in base alla metrica node/ephemeral_storage/allocatable_bytes.
    • A livello di team, la relazione tra il limite di risorse e le risorse utilizzate e richieste.
      • Utilizzato: la quantità di spazio di archiviazione temporanea locale utilizzata da tutti i container in tutti gli spazi dei nomi associati a un ambito. Calcolata in base alla metrica container/ephemeral_storage/used_bytes.
      • Richiesta: la quantità di spazio di archiviazione temporaneo locale richiesta da tutti i container in tutti gli spazi dei nomi associati a un ambito. Calcolata in base alla metrica container/ephemeral_storage/request_bytes.
      • Limite: la quantità massima di spazio di archiviazione temporanea locale disponibile per tutti i container in tutti gli spazi dei nomi associati a un ambito. Calcolata in base alla metrica container/ephemeral_storage/limit_bytes.
  • Principali utilizzi del disco per cluster: elenco di cluster ordinato in base alla media di tutti i punti in tempo per un determinato intervallo di tempo, dove il punto in tempo è un rapporto tra le risorse allocabili e quelle utilizzate per un determinato cluster.
  • Utilizzo del disco principale per spazio dei nomi: elenco di spazi dei nomi ordinati in base a una media di tutti i punti nel tempo per una determinata finestra temporale, dove il punto nel tempo è un rapporto tra le risorse utilizzate e richieste per un determinato spazio dei nomi.
    • Utilizzato: la quantità di spazio di archiviazione temporanea locale utilizzata da tutti i container in uno spazio dei nomi. Calcolata in base alla metrica container/ephemeral_storage/used_bytes.
    • Richiesta: la quantità di spazio di archiviazione temporanea locale richiesta da tutti i container in uno spazio dei nomi. Calcolata in base alla metrica container/ephemeral_storage/request_bytes.

Distribuzione degli errori per spazio dei nomi (solo a livello di team)

Elenco di spazi dei nomi ordinati in base al numero più elevato di log degli errori per un determinato intervallo di tempo. I log vengono raccolti da Cloud Logging.

Distribuzione dei conteggi dei riavvii per spazio dei nomi (solo a livello di team)

Elenco di spazi dei nomi ordinati in base al numero più alto di riavvii di container per una determinata finestra temporale. Calcolata dalla metrica container/restart_count.

Risoluzione dei problemi

Le metriche non vengono caricate per i nuovi cluster

Se hai creato nuovi cluster, a seconda dell'intervallo di tempo selezionato, potresti visualizzare No Data nella dashboard Monitoraggio o le metriche. Ad esempio, se hai creato un cluster nell'ultima ora e selezioni un intervallo di tempo di 1 ora o 6 ore, la dashboard potrebbe restituire alcune metriche per i tuoi carichi di lavoro. Tuttavia, se selezioni un intervallo di tempo di 1 giorno o più, potresti visualizzare No data in tutta la dashboard.

Questo perché Cloud Monitoring raccoglie i dati in periodi diversi (intervalli) per finestre temporali diverse. Per finestre temporali di 1 ora e 6 ore, i dati vengono raccolti in periodi di 1 minuto. Pertanto, se il cluster esiste da alcuni minuti, vedrai le metriche per queste finestre temporali.

Per finestre temporali di 1 giorno e 1 settimana, Cloud Monitoring raccoglie i dati in periodi di 1 ora. Se il cluster esiste da meno di un'ora, potresti non vedere dati per queste finestre temporali.

Se si verifica questo errore, controlla la dashboard dopo un po' di tempo dalla creazione del nuovo cluster.