RUNNING
atau ERROR
.
Dengan memulai ulang resource persisten, Anda dapat memulihkan diri dari error yang tidak dapat dipulihkan sendiri oleh resource persisten. Anda juga dapat melakukan reboot resource persisten untuk mendapatkan cluster yang lebih baru secara manual. Halaman ini menunjukkan cara
me-reboot resource persisten menggunakan konsol Google Cloud dan REST API.
Peran yang diperlukan
Untuk mendapatkan izin yang Anda perlukan untuk memulai ulang resource persisten, minta administrator Anda untuk memberi Anda peran IAM Vertex AI Administrator (roles/aiplatform.admin
) di project Anda.
Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.
Peran bawaan ini berisi izin
aiplatform.persistentResources.update
,
yang diperlukan untuk
me-reboot resource persisten.
Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.
Mulai ulang resource persisten
Pilih salah satu tab berikut untuk mengetahui petunjuk cara me-reboot resource persisten. Pastikan tidak ada tugas pelatihan yang berjalan di resource persisten.
Konsol
Untuk memulai ulang resource persisten di konsol Google Cloud , lakukan hal berikut:
Di konsol Google Cloud , buka halaman Persistent resources.
Di samping nama resource persisten yang ingin Anda mulai ulang, klik elips vertikal (
).Klik Mulai ulang.
Klik Konfirmasi.
gcloud
Sebelum menggunakan salah satu data perintah di bawah, lakukan penggantian berikut:
- PROJECT_ID: Project ID resource persisten yang ingin Anda mulai ulang.
- LOCATION: Region resource persisten yang ingin Anda mulai ulang.
- PERSISTENT_RESOURCE_ID: ID resource persisten yang ingin Anda mulai ulang.
Jalankan perintah berikut:
Linux, macOS, atau Cloud Shell
gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID \ --project=PROJECT_ID \ --region=LOCATION
Windows (PowerShell)
gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID ` --project=PROJECT_ID ` --region=LOCATION
Windows (cmd.exe)
gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID ^ --project=PROJECT_ID ^ --region=LOCATION
Anda akan melihat respons seperti berikut:
Using endpoint [https://us-central1-aiplatform.googleapis.com/] Request to reboot the PersistentResource [projects/sample-project/locations/us-central1/persistentResources/test-persistent-resource] has been sent. You may view the status of your persistent resource with the command $ gcloud ai persistent-resources describe projects/sample-project/locations/us-central1/persistentResources/test-persistent-resource
REST
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
- PROJECT_ID: Project ID resource persisten yang ingin Anda mulai ulang.
- LOCATION: Region resource persisten yang ingin Anda mulai ulang.
- PERSISTENT_RESOURCE_ID: ID resource persisten yang ingin Anda mulai ulang.
Metode HTTP dan URL:
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/persistentResources/PERSISTENT_RESOURCE_ID:reboot
Untuk mengirim permintaan, perluas salah satu opsi berikut:
Anda akan melihat respons JSON seperti berikut:
response:{ "name": "projects/123456789012/locations/us-central1/persistentResources/test-persistent-resource/operations/1234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.RebootPersistentResourceOperationMetadata", "genericMetadata": { "createTime": "2024-03-18T17:31:54.955004Z", "updateTime": "2024-03-18T17:31:55.204817Z", "state": "RUNNING", "worksOn": [ "projects/123456789012/locations/us-central1/persistentResources/test-persistent-resource" ] }, "progressMessage": "Waiting for persistent resource shut down." } }
Mem-reboot resource persisten adalah
operasi yang berjalan lama,
selama resource persisten tidak dapat dihapus. Operasi berisi kolom
progressMessage
yang diisi dengan status error jika terjadi error. Setelah
operasi menunjukkan "done: true"
,
periksa status
resource persisten. Jika resource persisten berada dalam status RUNNING
, mulai ulang berhasil dan siap menjalankan tugas pelatihan.
Batasan
Berikut adalah batasan untuk memulai ulang resource persisten:
- Dalam beberapa kasus, kapasitas resource langka dapat hilang saat me-reboot resource persisten. Retensi resource penuh tidak dijamin.
- Mulai ulang tidak tersedia di Ray on Vertex AI.
- Resource persisten yang berisi worker pool yang diskalakan otomatis akan di-reboot dengan jumlah replika minimum.
Langkah berikutnya
- Mempelajari resource persisten.
- Membuat dan menggunakan resource persisten.
- Menjalankan tugas pelatihan pada resource persisten.
- Mendapatkan informasi tentang resource persisten.
- Menghapus resource persisten.