RUNNING
o ERROR
.
Il riavvio di una risorsa permanente consente di recuperare da errori da cui la risorsa permanente non può recuperare autonomamente. Puoi anche riavviare una risorsa permanente per ottenere manualmente cluster più aggiornati. Questa pagina mostra come riavviare una risorsa persistente utilizzando la console Google Cloud e l'API REST.
Ruoli obbligatori
Per ottenere l'autorizzazione necessaria per riavviare una risorsa persistente,
chiedi all'amministratore di concederti il ruolo IAM Amministratore Vertex AI (roles/aiplatform.admin
) nel progetto.
Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.
Questo ruolo predefinito contiene l'autorizzazione
aiplatform.persistentResources.update
necessaria per riavviare una risorsa persistente.
Potresti anche ottenere questa autorizzazione con ruoli personalizzati o altri ruoli predefiniti.
Riavviare una risorsa permanente
Seleziona una delle seguenti schede per istruzioni su come riavviare una risorsa permanente. Assicurati che non siano in esecuzione job di addestramento nella risorsa permanente.
Console
Per riavviare una risorsa persistente nella console Google Cloud:
Nella console Google Cloud, vai alla pagina Risorse permanenti.
Accanto al nome della risorsa persistente che vuoi riavviare, fai clic su i tre puntini verticali (
).Fai clic su Riavvia.
Fai clic su Conferma.
gcloud
Prima di utilizzare i dati dei comandi riportati di seguito, effettua le seguenti sostituzioni:
- PROJECT_ID: l'ID progetto della risorsa permanente che vuoi riavviare.
- LOCATION: la regione della risorsa permanente che vuoi riavviare.
- PERSISTENT_RESOURCE_ID: l'ID della risorsa permanente che vuoi riavviare.
Esegui il seguente comando:
Linux, macOS o Cloud Shell
gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID \ --project=PROJECT_ID \ --region=LOCATION
Windows (PowerShell)
gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID ` --project=PROJECT_ID ` --region=LOCATION
Windows (cmd.exe)
gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID ^ --project=PROJECT_ID ^ --region=LOCATION
Dovresti ricevere una risposta simile alla seguente:
Using endpoint [https://us-central1-aiplatform.googleapis.com/] Request to reboot the PersistentResource [projects/sample-project/locations/us-central1/persistentResources/test-persistent-resource] has been sent. You may view the status of your persistent resource with the command $ gcloud ai persistent-resources describe projects/sample-project/locations/us-central1/persistentResources/test-persistent-resource
REST
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- PROJECT_ID: l'ID progetto della risorsa permanente che vuoi riavviare.
- LOCATION: la regione della risorsa permanente che vuoi riavviare.
- PERSISTENT_RESOURCE_ID: l'ID della risorsa permanente che vuoi riavviare.
Metodo HTTP e URL:
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/persistentResources/PERSISTENT_RESOURCE_ID:reboot
Per inviare la richiesta, espandi una di queste opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
response:{ "name": "projects/123456789012/locations/us-central1/persistentResources/test-persistent-resource/operations/1234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.RebootPersistentResourceOperationMetadata", "genericMetadata": { "createTime": "2024-03-18T17:31:54.955004Z", "updateTime": "2024-03-18T17:31:55.204817Z", "state": "RUNNING", "worksOn": [ "projects/123456789012/locations/us-central1/persistentResources/test-persistent-resource" ] }, "progressMessage": "Waiting for persistent resource shut down." } }
Il riavvio di una risorsa permanente è un'operazione che richiede molto tempo, durante la quale la risorsa permanente non può essere eliminata. L'operazione contiene un
progressMessage
campo che viene compilato con uno stato di errore, se si verifica. Dopo che l'operazione indica "done: true"
,
controlla lo stato
della risorsa persistente. Se la risorsa permanente è nello stato RUNNING
, il riavvio è andato a buon fine ed è possibile eseguire i job di addestramento.
Limitazioni
Di seguito sono riportate le limitazioni per il riavvio di una risorsa permanente:
- In alcuni casi, è possibile perdere la capacità di risorse scarse durante il riavvio di una risorsa persistente. La conservazione completa delle risorse non è garantita.
- Il riavvio non è disponibile su Ray on Vertex AI.
- Le risorse permanenti contenenti pool di worker con scalabilità automatica si riavviano con il numero minimo di repliche.
Passaggi successivi
- Scopri di più sulle risorse permanenti.
- Crea e utilizza una risorsa permanente.
- Esegui job di addestramento su una risorsa permanente.
- Ottenere informazioni su una risorsa permanente.
- Eliminare una risorsa permanente.