Configura i limiti della CPU per i servizi

Questa pagina descrive come specificare il numero di CPU da utilizzare per ogni istanza Cloud Run. Per impostazione predefinita, le istanze di container Cloud Run sono limitate a 1 CPU. Puoi aumentare o diminuire questo valore come descritto in questa pagina.

Questa pagina descrive anche come attivare o disattivare l'aumento della CPU all'avvio, una funzionalità che aumenta temporaneamente l'allocazione della CPU durante l'avvio dell'istanza per ridurre la latenza di avvio.

Impostare e aggiornare i limiti di CPU

Per impostazione predefinita, ogni istanza è limitata a 1 CPU. Puoi impostare uno qualsiasi dei valori mostrati nella tabella seguente.

Tabella CPU e memoria

Di seguito sono riportati i requisiti minimi di memoria per le CPU:

CPU Memoria minima
1 128 MiB
2 128 MiB
4 2 GiB
6 4 GiB
8 4 GiB

In alternativa, se vuoi utilizzare meno di 1 CPU, puoi selezionare un valore compreso tra 0,08 e 1, con incrementi di 0,01. I valori maggiori di 1 devono essere numeri interi. Se utilizzi meno di 1 CPU, vengono applicati i seguenti requisiti:

Impostazione Requisito
Memoria È necessario un minimo di 0,5 CPU per impostare un limite di memoria superiore a 512 MiB.
È necessaria almeno una CPU per impostare un limite di memoria superiore a 1 GiB.
Contemporaneità Il livello massimo di contemporaneità deve essere impostato su 1.
Fatturazione Le impostazioni di fatturazione devono essere impostate sulla fatturazione basata sulle richieste.
Ambiente di esecuzione Devi utilizzare l'ambiente di esecuzione di prima generazione.

Ruoli obbligatori

Per ottenere le autorizzazioni necessarie per configurare ed eseguire il deployment dei servizi Cloud Run, chiedi all'amministratore di concederti i seguenti ruoli IAM:

Per un elenco di ruoli e autorizzazioni IAM associati a Cloud Run, consulta Ruoli IAM Cloud Run e Autorizzazioni IAM Cloud Run. Se il tuo servizio Cloud Run interagisce con le APIGoogle Cloud , come le librerie client Cloud, consulta la guida alla configurazione dell'identità del servizio. Per ulteriori informazioni sulla concessione dei ruoli, consulta Autorizzazioni di deployment e Gestire l'accesso.

Configura i limiti di CPU

Qualsiasi modifica alla configurazione comporta la creazione di una nuova revisione. Anche le revisioni successive riceveranno automaticamente questa impostazione di configurazione, a meno che tu non apporti aggiornamenti espliciti per modificarla.

Puoi impostare i limiti della CPU utilizzando la console Google Cloud , la riga di comando gcloud o un file YAML quando crei un nuovo servizio o esegui il deployment di una nuova revisione:

Console

  1. Nella console Google Cloud , vai a Cloud Run:

    Vai a Cloud Run

  2. Seleziona Servizi dal menu e fai clic su Esegui il deployment del contenitore per configurare un nuovo servizio. Se stai configurando un servizio esistente, fai clic sul servizio, quindi su Modifica ed esegui il deployment della nuova revisione.

  3. Se stai configurando un nuovo servizio, compila la pagina delle impostazioni iniziali del servizio, quindi fai clic su Container, volumi, networking, sicurezza per espandere la pagina di configurazione del servizio.

  4. Fai clic sulla scheda Contenitore.

    immagine

    • Seleziona il limite di CPU che preferisci dall'elenco a discesa, utilizzando Personalizzato se vuoi utilizzare meno di 1 CPU. Seleziona un valore di 1, 2, 4, 6 o 8 CPU oppure, per meno di 1 CPU, specifica un valore compreso tra 0,08 e meno di 1,00, con incrementi di 0,01. (Consulta la tabella nella sezione Impostazione e aggiornamento dei limiti di CPU per le impostazioni richieste.)
  5. Fai clic su Crea o Esegui il deployment.

gcloud

Puoi aggiornare i limiti della CPU per un determinato servizio utilizzando il seguente comando:

gcloud run services update SERVICE --cpu CPU

Sostituisci

  • SERVICE con il nome del tuo servizio
  • CPU con il limite di CPU desiderato. Specifica il valore 1, 2, 4, 6 o 8 CPU oppure, per meno di 1 CPU, specifica un valore compreso tra 0,08 e meno di 1,00, con incrementi di 0,01. (Consulta la tabella nella sezione Impostazione e aggiornamento dei limiti di CPU per le impostazioni richieste.)

Puoi anche impostare la CPU durante la distribuzione utilizzando il comando:

gcloud run deploy --image IMAGE_URL --cpu CPU

Sostituisci

  • IMAGE_URL con un riferimento all'immagine container, ad esempio us-docker.pkg.dev/cloudrun/container/hello:latest. Se utilizzi Artifact Registry, il repository REPO_NAME deve essere già stato creato. L'URL ha la forma LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG .
  • CPU con il valore 1, 2, 4, 6 o 8 CPU oppure, per meno di una CPU, specifica un valore compreso tra 0,08 e meno di 1,00, con incrementi di 0,01. (Consulta la tabella nella sezione Impostazione e aggiornamento dei limiti di CPU per le impostazioni richieste.)

YAML

  1. Se stai creando un nuovo servizio, salta questo passaggio. Se stai aggiornando un servizio esistente, scarica la relativa configurazione YAML:

    gcloud run services describe SERVICE --format export > service.yaml
  2. Aggiorna l'attributo cpu:

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        metadata:
          name: REVISION
        spec:
          containers:
          - image: IMAGE
            resources:
              limits:
                cpu: CPU

    Sostituisci

    • SERVICE con il nome del tuo servizio Cloud Run
    • IMAGE_URL con un riferimento all'immagine container, ad esempio us-docker.pkg.dev/cloudrun/container/hello:latest. Se utilizzi Artifact Registry, il repository REPO_NAME deve essere già stato creato. L'URL ha la forma LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG
    • CPU con il valore limite della CPU desiderato. Specifica il valore 1, 2, 4, 6 o 8 CPU oppure, per meno di 1 CPU, specifica un valore compreso tra 0,08 e meno di 1,00, con incrementi di 0,01. (Consulta la tabella nella sezione Impostazione e aggiornamento dei limiti di CPU per le impostazioni richieste.)
    • REVISION con un nuovo nome di revisione o eliminalo (se presente). Se fornisci un nuovo nome di revisione, questo deve soddisfare i seguenti criteri:
      • Inizia con SERVICE-
      • Contiene solo lettere minuscole, numeri e -
      • Non termina con -
      • Non supera i 63 caratteri
  3. Crea o aggiorna il servizio utilizzando il seguente comando:

    gcloud run services replace service.yaml

Terraform

Per scoprire come applicare o rimuovere una configurazione Terraform, consulta Comandi Terraform di base.

Aggiungi quanto segue a una risorsa google_cloud_run_v2_service nella configurazione Terraform:

resource "google_cloud_run_v2_service" "default" {
  name     = "cloudrun-service-cpu"
  location = "us-central1"

  deletion_protection = false # set to "true" in production

  template {
    containers {
      image = "us-docker.pkg.dev/cloudrun/container/hello"
      resources {
        limits = {
          # CPU usage limit
          cpu = "1"
        }
      }
    }
  }
}

La risorsa google_cloud_run_v2_service precedente specifica un limite di CPU inferiore a template.containers.resources.limits.

Sostituisci 1 con il numero di CPU che preferisci. Suggerimento: 1 corrisponde a 1 vCPU.

Impostare il boosting della CPU all'avvio

La funzionalità Boosting della CPU all'avvio per le revisioni fornisce CPU aggiuntiva durante il tempo di avvio dell'istanza e per 10 secondi dopo l'avvio dell'istanza.

L'aumento effettivo della CPU varia a seconda delle impostazioni del limite di CPU:

Limite CPU CPU potenziata
0-1 2
2 4
4 8
6 8
8 8

Ti viene addebitato il costo della CPU con boost allocata per la durata del tempo di avvio del container. Ad esempio, se il tempo di avvio del container è di 15 secondi e allochi 2 CPU, con l'aumento della CPU di avvio ti verranno addebitate 4 CPU durante il tempo di avvio dell'istanza (che potrebbe essere più breve), inclusi i 10 secondi successivi al termine dell'avvio del container, e 2 CPU durante il resto del ciclo di vita del container.

Se il deployment di Cloud Run utilizza i sidecar e attivi l'aumento della CPU all'avvio, tutti i container ricevono l'aumento della CPU. Cloud Run determina la quantità di CPU aumentata per ogni container in base al limite di CPU.

Puoi attivare o disattivare l'aumento della CPU all'avvio utilizzando la console Google Cloud , Google Cloud CLI, un file YAML o un file Terraform.

Console

  1. Nella console Google Cloud , vai a Cloud Run:

    Vai a Cloud Run

  2. Seleziona Servizi dal menu e fai clic su Esegui il deployment del contenitore per configurare un nuovo servizio. Se stai configurando un servizio esistente, fai clic sul servizio, quindi su Modifica ed esegui il deployment della nuova revisione.

  3. Se stai configurando un nuovo servizio, compila la pagina delle impostazioni iniziali del servizio, quindi fai clic su Container, volumi, networking, sicurezza per espandere la pagina di configurazione del servizio.

  4. Fai clic sulla scheda Contenitore.

    immagine

    • Per attivare il boosting della CPU all'avvio, seleziona la casella di controllo Boosting della CPU all'avvio. Per disattivare questa funzionalità, deseleziona la casella di controllo.
  5. Fai clic su Crea o Esegui il deployment.

gcloud

  1. Puoi abilitare l'aumento della CPU all'avvio per un determinato servizio utilizzando il seguente comando:

    gcloud run services update SERVICE --cpu-boost

    Sostituisci SERVICE con il nome del tuo servizio

    Puoi attivare l'aumento della CPU all'avvio durante l'deployment utilizzando il comando:

    gcloud run deploy --image IMAGE_URL --cpu-boost

    Sostituisci IMAGE_URL con un riferimento all'immagine container, ad esempio us-docker.pkg.dev/cloudrun/container/hello:latest. Se utilizzi Artifact Registry, il repository REPO_NAME deve essere già stato creato. L'URL ha la forma LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG .

  2. Puoi disattivare l'aumento della CPU all'avvio per un determinato servizio utilizzando questo comando:

    gcloud run services update SERVICE --no-cpu-boost

    Sostituisci SERVICE con il nome del tuo servizio

    Puoi disattivare l'aumento della CPU all'avvio durante la distribuzione utilizzando il comando:

    gcloud run deploy --image IMAGE_URL --no-cpu-boost

YAML

  1. Se stai creando un nuovo servizio, salta questo passaggio. Se stai aggiornando un servizio esistente, scarica la relativa configurazione YAML:

    gcloud run services describe SERVICE --format export > service.yaml
  2. Aggiorna l'attributo run.googleapis.com/startup-cpu-boost specificando 'true' per attivare il boosting della CPU all'avvio o 'false' per disattivarlo:

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        metadata:
          annotations:
            run.googleapis.com/startup-cpu-boost: 'true'

    Sostituisci

    • SERVICE con il nome del tuo servizio Cloud Run
  3. Crea o aggiorna il servizio utilizzando il seguente comando:

    gcloud run services replace service.yaml

Terraform

Per scoprire come applicare o rimuovere una configurazione Terraform, consulta Comandi Terraform di base.

Aggiungi quanto segue a una risorsa google_cloud_run_v2_service nella configurazione Terraform:

resource "google_cloud_run_v2_service" "default" {
  name     = "SERVICE"
  location = "REGION"

  template {
    containers {
      image = "us-docker.pkg.dev/cloudrun/container/hello"
      resources {
        startup_cpu_boost = CPU_BOOST
      }
    }
  }
}

Sostituisci:

  • SERVICE con il nome del tuo servizio Cloud Run.
  • REGION con la regione Google Cloud . Ad esempio europe-west1.
  • CPU_BOOST con true per attivare l'aumento della CPU all'avvio o con false per disattivarlo.

Visualizza le impostazioni della CPU

Per visualizzare le impostazioni della CPU correnti per il tuo servizio Cloud Run:

Console

  1. Nella console Google Cloud , vai a Cloud Run:

    Vai a Cloud Run

  2. Fai clic sul servizio che ti interessa per aprire la pagina Dettagli servizio.

  3. Fai clic sulla scheda Revisioni.

  4. Nel riquadro dei dettagli a destra, l'impostazione della CPU è elencata nella scheda Container.

gcloud

  1. Utilizza questo comando:

    gcloud run services describe SERVICE
  2. Individua l'impostazione della CPU nella configurazione restituita.

Threading dell'applicazione e utilizzo della CPU

Quando selezioni un limite di CPU superiore a 1 vCPU, considera il modello di threading della tua applicazione. Durante lo scaling automatico, Cloud Run utilizza l'utilizzo medio della CPU in tutte le CPU allocate. Se la tua applicazione è single-thread, potrebbe utilizzare completamente un solo core, il che comporta un basso utilizzo medio della CPU anche sotto carico. Ciò può impedire la scalabilità automatica basata sulla CPU come previsto.

Per evitare questo comportamento per un'applicazione single-thread, se i requisiti di memoria lo consentono, ti consigliamo di iniziare con 1 vCPU. Ciò si traduce in una migliore scalabilità automatica basata sulla CPU. Se le esigenze di memoria più elevate forzano la selezione di più CPU per un'applicazione a thread singolo, valuta la possibilità di ottimizzare l'impostazione di concorrenza.