Memulai ulang resource persisten

Anda dapat melakukan booting ulang resource persisten yang berada dalam status RUNNING atau ERROR. Dengan memulai ulang resource persisten, Anda dapat memulihkan diri dari error yang tidak dapat dipulihkan sendiri oleh resource persisten. Anda juga dapat melakukan reboot resource persisten untuk mendapatkan cluster yang lebih baru secara manual. Halaman ini menunjukkan cara me-reboot resource persisten menggunakan konsol Google Cloud dan REST API.

Peran yang diperlukan

Untuk mendapatkan izin yang Anda perlukan untuk memulai ulang resource persisten, minta administrator Anda untuk memberi Anda peran IAM Vertex AI Administrator (roles/aiplatform.admin) di project Anda. Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.

Peran bawaan ini berisi izin aiplatform.persistentResources.update , yang diperlukan untuk me-reboot resource persisten.

Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.

Mulai ulang resource persisten

Pilih salah satu tab berikut untuk mengetahui petunjuk cara me-reboot resource persisten. Pastikan tidak ada tugas pelatihan yang berjalan di resource persisten.

Konsol

Untuk memulai ulang resource persisten di konsol Google Cloud , lakukan hal berikut:

  1. Di konsol Google Cloud , buka halaman Persistent resources.

    Buka Resource persisten

  2. Di samping nama resource persisten yang ingin Anda mulai ulang, klik elips vertikal ().

  3. Klik Mulai ulang.

  4. Klik Konfirmasi.

gcloud

Sebelum menggunakan salah satu data perintah di bawah, lakukan penggantian berikut:

  • PROJECT_ID: Project ID resource persisten yang ingin Anda mulai ulang.
  • LOCATION: Region resource persisten yang ingin Anda mulai ulang.
  • PERSISTENT_RESOURCE_ID: ID resource persisten yang ingin Anda mulai ulang.

Jalankan perintah berikut:

Linux, macOS, atau Cloud Shell

gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID \
    --project=PROJECT_ID \
    --region=LOCATION

Windows (PowerShell)

gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID `
    --project=PROJECT_ID `
    --region=LOCATION

Windows (cmd.exe)

gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID ^
    --project=PROJECT_ID ^
    --region=LOCATION

Anda akan melihat respons seperti berikut:

Using endpoint [https://us-central1-aiplatform.googleapis.com/]
Request to reboot the PersistentResource [projects/sample-project/locations/us-central1/persistentResources/test-persistent-resource] has been sent.

You may view the status of your persistent resource with the command

  $ gcloud ai persistent-resources describe projects/sample-project/locations/us-central1/persistentResources/test-persistent-resource

REST

Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:

  • PROJECT_ID: Project ID resource persisten yang ingin Anda mulai ulang.
  • LOCATION: Region resource persisten yang ingin Anda mulai ulang.
  • PERSISTENT_RESOURCE_ID: ID resource persisten yang ingin Anda mulai ulang.

Metode HTTP dan URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/persistentResources/PERSISTENT_RESOURCE_ID:reboot

Untuk mengirim permintaan, perluas salah satu opsi berikut:

Anda akan melihat respons JSON seperti berikut:

response: 
  {
    "name": "projects/123456789012/locations/us-central1/persistentResources/test-persistent-resource/operations/1234567890123456789",
    "metadata": {
      "@type": "type.googleapis.com/google.cloud.aiplatform.v1.RebootPersistentResourceOperationMetadata",
      "genericMetadata": {
        "createTime": "2024-03-18T17:31:54.955004Z",
        "updateTime": "2024-03-18T17:31:55.204817Z",
        "state": "RUNNING",
        "worksOn": [
          "projects/123456789012/locations/us-central1/persistentResources/test-persistent-resource"
        ]
      },
      "progressMessage": "Waiting for persistent resource shut down."
    }
  }

Mem-reboot resource persisten adalah operasi yang berjalan lama, selama resource persisten tidak dapat dihapus. Operasi berisi kolom progressMessage yang diisi dengan status error jika terjadi error. Setelah operasi menunjukkan "done: true", periksa status resource persisten. Jika resource persisten berada dalam status RUNNING, mulai ulang berhasil dan siap menjalankan tugas pelatihan.

Batasan

Berikut adalah batasan untuk memulai ulang resource persisten:

  • Dalam beberapa kasus, kapasitas resource langka dapat hilang saat me-reboot resource persisten. Retensi resource penuh tidak dijamin.
  • Mulai ulang tidak tersedia di Ray on Vertex AI.
  • Resource persisten yang berisi worker pool yang diskalakan otomatis akan di-reboot dengan jumlah replika minimum.

Langkah berikutnya