Mengelola resource dalam antrean
Resource dalam antrean memungkinkan Anda meminta resource Cloud TPU secara berurutan. Saat Anda meminta resource dalam antrean, permintaan akan ditambahkan ke antrean yang dikelola oleh layanan Cloud TPU. Saat resource yang diminta tersedia, resource tersebut akan ditetapkan ke project Google Cloud Anda untuk penggunaan eksklusif langsung. Resource akan tetap ditetapkan ke project Anda kecuali jika Anda menghapusnya atau resource tersebut dihentikan. Hanya TPU Spot VM dan TPU preemptible yang memenuhi syarat untuk preemption.
Anda dapat menentukan waktu mulai dan berakhir opsional dalam permintaan resource yang diantrekan. Waktu mulai menentukan waktu paling awal untuk memenuhi permintaan. Jika permintaan belum diisi pada waktu berakhir yang ditentukan, permintaan akan berakhir. Permintaan tetap berada dalam antrean setelah masa berlakunya berakhir.
Permintaan resource yang diantrekan dapat berada dalam salah satu status berikut:
WAITING_FOR_RESOURCES
- Permintaan telah lulus validasi awal dan telah ditambahkan ke antrean. Resource tetap dalam status ini hingga ada resource gratis yang cukup untuk mulai menyediakan permintaan Anda atau interval alokasi berakhir. Saat permintaan tinggi, tidak semua permintaan dapat segera disediakan. Jika Anda memerlukan TPU yang lebih andal, pertimbangkan untuk membeli reservasi.
PROVISIONING
- Permintaan telah dipilih dari antrean dan sumber dayanya sedang dialokasikan.
ACTIVE
- Permintaan telah dialokasikan. Saat permintaan resource yang diantrekan berada dalam status
ACTIVE
, Anda dapat mengelola VM TPU seperti yang dijelaskan dalam Mengelola TPU. FAILED
- Permintaan tidak dapat diselesaikan, baik karena ada masalah dengan permintaan atau resource yang diminta tidak tersedia dalam interval alokasi. Permintaan tetap berada dalam antrean hingga dihapus secara eksplisit.
SUSPENDING
- Resource yang terkait dengan permintaan sedang dihapus.
SUSPENDED
- Resource yang ditentukan dalam permintaan telah dihapus. Jika permintaan
berada dalam status
SUSPENDED
, permintaan tersebut tidak lagi memenuhi syarat untuk alokasi lebih lanjut.
Prasyarat
Sebelum menjalankan perintah dalam panduan ini, Anda harus menginstal Google Cloud CLI, membuat project Google Cloud , dan mengaktifkan Cloud TPU API. Untuk mengetahui petunjuknya, lihat Menyiapkan lingkungan Cloud TPU.
Jika Anda menggunakan salah satu Library Klien Cloud, ikuti petunjuk penyiapan untuk bahasa yang Anda gunakan:
Meminta resource dalam antrean on-demand
Resource on-demand tidak akan di-preempt, tetapi kuota on-demand tidak menjamin akan ada cukup resource Cloud TPU yang tersedia untuk memenuhi permintaan Anda. Untuk mengetahui informasi selengkapnya tentang resource sesuai permintaan, lihat Jenis kuota.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central1-a \ --accelerator-type v5litepod-8 \ --runtime-version v2-alpha-tpuv5-lite
Deskripsi parameter perintah
queued-resource-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID yang ditetapkan pengguna untuk TPU yang dibuat saat permintaan resource dalam antrean dialokasikan.
project
- Project Google Cloud Anda.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat Versi TPU.
runtime-version
- Versi software Cloud TPU.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central1-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5litepod-8', 'runtime_version': 'v2-alpha-tpuv5-lite', } } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central1-a/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi parameter perintah
queued-resource-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID yang ditetapkan pengguna untuk TPU yang dibuat saat permintaan resource dalam antrean dialokasikan.
project
- Project Google Cloud Anda.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat Versi TPU.
runtime-version
- Versi software Cloud TPU.
Konsol
Di konsol Google Cloud , buka halaman TPU:
Klik Buat TPU.
Di kolom Name, masukkan nama untuk TPU Anda.
Di kotak Zone, pilih zona tempat Anda ingin membuat TPU.
Di kotak TPU type, pilih jenis akselerator. Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
Di kotak Versi software TPU, pilih versi software. Saat membuat VM Cloud TPU, versi software TPU menentukan versi runtime TPU yang akan diinstal. Untuk mengetahui informasi selengkapnya, lihat versi software TPU.
Klik tombol Aktifkan antrean.
Di kolom Queued resource name, masukkan nama untuk permintaan resource yang diantrekan.
Klik Buat untuk membuat permintaan resource dalam antrean.
Java
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Meminta resource dalam antrean menggunakan reservasi
Anda dapat meminta resource dalam antrean menggunakan reservasi. Untuk membeli reservasi, hubungi tim akun Anda. Google Cloud
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central1-a \ --accelerator-type v5litepod-8 \ --runtime-version v2-alpha-tpuv5-lite \ --reserved
Deskripsi parameter perintah
queued-resource-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID yang ditetapkan pengguna untuk TPU yang dibuat saat permintaan resource dalam antrean dialokasikan.
project
- Project Google Cloud Anda.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat Versi TPU.
runtime-version
- Versi software Cloud TPU.
reserved
- Gunakan tanda ini saat meminta resource dalam antrean sebagai bagian dari reservasi Cloud TPU.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central1-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5litepod-8', 'runtime_version': 'v2-alpha-tpuv5-lite', } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central1-a/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi parameter perintah
queued-resource-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID yang ditetapkan pengguna untuk TPU yang dibuat saat permintaan resource dalam antrean dialokasikan.
project
- Project Google Cloud Anda.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat Versi TPU.
runtime-version
- Versi software Cloud TPU.
reserved
- Gunakan tanda ini saat meminta resource dalam antrean sebagai bagian dari reservasi Cloud TPU.
Konsol
Di konsol Google Cloud , buka halaman TPU:
Klik Buat TPU.
Di kolom Name, masukkan nama untuk TPU Anda.
Di kotak Zone, pilih zona tempat Anda ingin membuat TPU.
Di kotak TPU type, pilih jenis akselerator. Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
Di kotak Versi software TPU, pilih versi software. Saat membuat VM Cloud TPU, versi software TPU menentukan versi runtime TPU yang akan diinstal. Untuk mengetahui informasi selengkapnya, lihat versi software TPU.
Klik tombol Aktifkan antrean.
Di kolom Queued resource name, masukkan nama untuk permintaan resource yang diantrekan.
Luaskan bagian Management.
Centang kotak Gunakan reservasi yang ada.
Klik Buat untuk membuat permintaan resource dalam antrean.
Meminta resource antrean TPU Spot VM
Spot VM adalah resource yang dapat di-preempt dan ditetapkan ke workload lain kapan saja. Resource Spot VM lebih murah, dan Anda mungkin mendapatkan akses ke resource lebih cepat dibandingkan dengan permintaan non-Spot VM. Untuk mengetahui informasi selengkapnya tentang TPU Spot VM, lihat Mengelola TPU Spot VM.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central1-a \ --accelerator-type v5litepod-8 \ --runtime-version v2-alpha-tpuv5-lite \ --spot
Deskripsi parameter perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID yang ditentukan pengguna dari TPU yang dibuat sebagai respons terhadap permintaan.
project
- ID project tempat resource dalam antrean dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat Versi TPU.
runtime-version
- Versi software Cloud TPU.
spot
- Flag boolean yang menentukan bahwa resource dalam antrean adalah Spot VM.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central1-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5litepod-8', 'runtime_version': 'v2-alpha-tpuv5-lite' } } }, 'spot': {} }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central1-a/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi parameter perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID yang ditentukan pengguna dari TPU yang dibuat sebagai respons terhadap permintaan.
project
- ID project tempat resource dalam antrean dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat Versi TPU.
runtime-version
- Versi software Cloud TPU.
spot
- Flag boolean yang menentukan bahwa resource dalam antrean adalah Spot VM.
Konsol
Di konsol Google Cloud , buka halaman TPU:
Klik Buat TPU.
Di kolom Name, masukkan nama untuk TPU Anda.
Di kotak Zone, pilih zona tempat Anda ingin membuat TPU.
Di kotak TPU type, pilih jenis akselerator. Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
Di kotak Versi software TPU, pilih versi software. Saat membuat VM Cloud TPU, versi software TPU menentukan versi runtime TPU yang akan diinstal. Untuk mengetahui informasi selengkapnya, lihat Versi software TPU.
Klik tombol Aktifkan antrean.
Di kolom Queued resource name, masukkan nama untuk permintaan resource yang diantrekan.
Luaskan bagian Management.
Centang kotak Make this a TPU Spot VM.
Klik Buat.
Java
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Meminta agar resource dalam antrean dialokasikan sebelum atau setelah waktu tertentu
Anda dapat menentukan waktu mulai atau waktu berakhir opsional dalam permintaan resource yang diantrekan. Waktu mulai atau durasi mulai menentukan waktu paling awal untuk mengisi permintaan. Waktu berakhir atau durasi berakhir menentukan berapa lama permintaan tetap valid. Jika permintaan belum dipenuhi pada waktu berakhir yang ditentukan atau dalam durasi yang ditentukan, permintaan akan berakhir. Setelah permintaan berakhir, permintaan tersebut tetap berada dalam antrean, tetapi tidak lagi memenuhi syarat untuk alokasi.
Anda juga dapat menentukan interval alokasi dengan menentukan waktu mulai atau durasi dan waktu berakhir atau durasi.
Untuk mengetahui daftar format stempel waktu dan durasi yang didukung, lihat Datetime.
Meminta agar resource dalam antrean dipenuhi setelah waktu tertentu
Dalam permintaan resource yang diantrekan, Anda dapat menentukan waktu atau durasi setelah resource harus dialokasikan.
gcloud
Perintah berikut meminta TPU v5p-4096 untuk dialokasikan setelah pukul 09.00 pada 14 Desember 2022.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-east5-a \ --accelerator-type v5p-4096 \ --runtime-version v2-alpha-tpuv5 \ --valid-after-time 2022-12-14T09:00:00Z
Deskripsi parameter perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID yang ditentukan pengguna dari TPU yang dibuat sebagai respons terhadap permintaan.
project
- Project Google Cloud tempat resource dalam antrean dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat Versi TPU.
runtime-version
- Versi software Cloud TPU.
valid-after-time
- Waktu, setelah itu, resource harus dialokasikan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat Google Cloud CLI topic datetime.
curl
Perintah berikut meminta TPU v5p-4096 untuk dialokasikan setelah pukul 09.00 pada 14 Desember 2022.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-east5-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5p-4096', 'runtime_version': 'v2-alpha-tpuv5', } } }, 'queueing_policy': { 'valid_after_time': { 'seconds': 2022-12-14T09:00:00Z } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-east5-a/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi parameter perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID yang ditentukan pengguna dari TPU yang dibuat sebagai respons terhadap permintaan.
project
- Project Google Cloud tempat resource dalam antrean dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat Versi TPU.
runtime-version
- Versi software Cloud TPU.
valid-after-time
- Waktu, setelah itu, resource harus dialokasikan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat Google Cloud CLI topic datetime.
Konsol
Di konsol Google Cloud , buka halaman TPU:
Klik Buat TPU.
Di kolom Name, masukkan nama untuk TPU Anda.
Di kotak Zone, pilih zona tempat Anda ingin membuat TPU.
Di kotak TPU type, pilih jenis akselerator. Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
Di kotak Versi software TPU, pilih versi software. Saat membuat VM Cloud TPU, versi software TPU menentukan versi runtime TPU yang akan diinstal. Untuk mengetahui informasi selengkapnya, lihat Versi software TPU.
Klik tombol Aktifkan antrean.
Di kolom Queued resource name, masukkan nama untuk permintaan resource yang diantrekan.
Di kolom Start request on, masukkan waktu setelah resource harus dialokasikan.
Klik Buat untuk membuat permintaan resource dalam antrean.
Contoh berikut meminta v5p-32 dialokasikan setelah enam jam.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-east5-a \ --accelerator-type v5p-32 \ --runtime-version v2-alpha-tpuv5 \ --valid-after-duration 6h
Deskripsi parameter perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID yang ditentukan pengguna dari TPU yang dibuat sebagai respons terhadap permintaan.
project
- Project Google Cloud tempat resource dalam antrean dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat Versi TPU.
runtime-version
- Versi software Cloud TPU.
valid-after-duration
- Durasi sebelum TPU tidak boleh disediakan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat topik Google Cloud CLI datetime
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-east5-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5p-32', 'runtime_version': 'v2-alpha-tpuv5', } } }, 'queueing_policy': { 'valid_after_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-east5-a/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi parameter perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID yang ditentukan pengguna dari TPU yang dibuat sebagai respons terhadap permintaan.
project
- Project Google Cloud tempat resource dalam antrean dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat Versi TPU.
runtime-version
- Versi software Cloud TPU.
valid-after-duration
- Durasi sebelum TPU tidak boleh disediakan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat topik Google Cloud CLI datetime
Java
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Meminta resource dalam antrean yang akan berakhir setelah waktu tertentu
Dalam permintaan resource yang diantrekan, Anda dapat menentukan berapa lama permintaan resource yang diantrekan tetap valid. Jika permintaan belum dipenuhi pada waktu atau durasi yang Anda tentukan, permintaan akan berakhir.
gcloud
Perintah berikut meminta TPU v5p-4096. Jika permintaan tidak dipenuhi paling lambat 14 Desember 2022 pukul 09.00, permintaan akan berakhir.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-east5-a \ --accelerator-type v5p-4096 \ --runtime-version v2-alpha-tpuv5 \ --valid-until-time 2022-12-14T09:00:00Z
Deskripsi parameter perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID yang ditentukan pengguna dari TPU yang dibuat sebagai respons terhadap permintaan.
project
- ID project tempat resource dalam antrean dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat Versi TPU.
runtime-version
- Versi software Cloud TPU.
valid-until-time
- Waktu setelah permintaan dibatalkan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat Google Cloud CLI topic datetime.
curl
Perintah berikut meminta TPU v5p-4096. Jika permintaan tidak dipenuhi paling lambat 14 Desember 2022 pukul 09.00, permintaan akan berakhir.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-east5-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5p-4096', 'runtime_version': 'v2-alpha-tpuv5', } } }, 'queueing_policy': { 'valid_until_time': { 'seconds': 1655197200 } } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-east5-a/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi parameter perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID yang ditentukan pengguna dari TPU yang dibuat sebagai respons terhadap permintaan.
project
- ID project tempat resource dalam antrean dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat Versi TPU.
runtime-version
- Versi software Cloud TPU.
valid-until-time
- Waktu setelah permintaan dibatalkan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat Google Cloud CLI topic datetime.
Konsol
Di konsol Google Cloud , buka halaman TPU:
Klik Buat TPU.
Di kolom Name, masukkan nama untuk TPU Anda.
Di kotak Zone, pilih zona tempat Anda ingin membuat TPU.
Di kotak TPU type, pilih jenis akselerator. Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
Di kotak Versi software TPU, pilih versi software. Saat membuat VM Cloud TPU, versi software TPU menentukan versi runtime TPU yang akan diinstal. Untuk mengetahui informasi selengkapnya, lihat Versi software TPU.
Klik tombol Aktifkan antrean.
Di kolom Queued resource name, masukkan nama untuk permintaan resource yang diantrekan.
Di kolom Batalkan permintaan pada, masukkan waktu saat permintaan resource yang diantrekan harus berakhir jika tidak diisi.
Klik Buat untuk membuat permintaan resource dalam antrean.
Contoh berikut meminta v5p-32. Permintaan akan berakhir jika tidak dipenuhi dalam waktu enam jam.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-east5-a \ --accelerator-type v5p-32 \ --runtime-version v2-alpha-tpuv5 \ --valid-until-duration 6h
Deskripsi parameter perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID yang ditentukan pengguna dari TPU yang dibuat sebagai respons terhadap permintaan.
project
- Project Google Cloud tempat resource dalam antrean dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat Versi TPU.
runtime-version
- Versi software Cloud TPU.
valid-until-duration
- Durasi validitas permintaan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat topik tanggal dan waktu Google Cloud CLI
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-east5-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5p-32', 'runtime_version': 'v2-alpha-tpuv5', } } }, 'queueing_policy': { 'valid_until_duration': { 'seconds': 21600 } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-east5-a/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi parameter perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID yang ditentukan pengguna dari TPU yang dibuat sebagai respons terhadap permintaan.
project
- Project Google Cloud tempat resource dalam antrean dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat Versi TPU.
runtime-version
- Versi software Cloud TPU.
valid-until-duration
- Durasi validitas permintaan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat topik tanggal dan waktu Google Cloud CLI
Python
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Meminta agar resource dalam antrean dialokasikan dalam interval tertentu
Anda dapat menentukan interval alokasi dengan menentukan waktu mulai atau durasi dan waktu berakhir atau durasi.
gcloud
Perintah berikut meminta v5p-32 dalam 5 jam 30 menit dari waktu saat ini, untuk dibuat paling lambat 14 Desember 2022 pukul 09.00.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-east5-a \ --accelerator-type v5p-32 \ --runtime-version v2-alpha-tpuv5 \ --valid-after-duration 5h30m \ --valid-until-time 2022-12-14T09:00:00Z
Deskripsi tanda perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID yang ditentukan pengguna dari TPU yang dibuat sebagai respons terhadap permintaan.
project
- ID project tempat resource dalam antrean dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat Versi TPU.
runtime-version
- Versi software Cloud TPU.
valid-until-time
- Waktu setelah permintaan dibatalkan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat Google Cloud CLI topic datetime.
valid-after-duration
- Durasi sebelum TPU tidak boleh disediakan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat Google Cloud CLI topic datetime.
curl
Perintah berikut meminta v5p-32 dalam 5 jam 30 menit dari waktu saat ini, untuk dibuat paling lambat 14 Desember 2022 pukul 09.00.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-east5-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5p-32', 'runtime_version': 'v2-alpha-tpuv5', } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-east5-a/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi tanda perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID yang ditentukan pengguna dari TPU yang dibuat sebagai respons terhadap permintaan.
project
- ID project tempat resource dalam antrean dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat Versi TPU.
runtime-version
- Versi software Cloud TPU.
valid-until-timw
- Waktu setelah permintaan dibatalkan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat Google Cloud CLI topic datetime.
valid-until-duration
- Durasi validitas permintaan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat Google Cloud CLI topic datetime.
Konsol
Di konsol Google Cloud , buka halaman TPU:
Klik Buat TPU.
Di kolom Name, masukkan nama untuk TPU Anda.
Di kotak Zone, pilih zona tempat Anda ingin membuat TPU.
Di kotak TPU type, pilih jenis akselerator. Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
Di kotak Versi software TPU, pilih versi software. Saat membuat VM Cloud TPU, versi software TPU menentukan versi runtime TPU yang akan diinstal. Untuk mengetahui informasi selengkapnya, lihat Versi software TPU.
Klik tombol Aktifkan antrean.
Di kolom Queued resource name, masukkan nama untuk permintaan resource yang diantrekan.
Di kolom Start request on, masukkan waktu setelah resource harus dialokasikan.
Di kolom Batalkan permintaan pada, masukkan waktu saat permintaan resource yang diantrekan harus berakhir jika tidak diisi.
Klik Buat untuk membuat permintaan resource dalam antrean.
Meminta resource dalam antrean dengan skrip startup
Anda dapat menentukan skrip yang akan dijalankan pada resource dalam antrean setelah resource tersebut disediakan.
gcloud
Saat menggunakan perintah gcloud
, Anda dapat menggunakan flag --metadata
atau --metadata-from-file
untuk menentukan perintah skrip atau file
yang berisi kode skrip. Contoh berikut membuat permintaan resource dalam antrean yang akan menjalankan skrip startup-script.sh
.
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central1-a \ --accelerator-type v5litepod-8 \ --runtime-version v2-alpha-tpuv5-lite \ --metadata-from-file='startup-script=startup-script.sh'
Deskripsi tanda perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID yang ditentukan pengguna dari TPU yang dibuat sebagai respons terhadap permintaan.
project
- ID project tempat resource dalam antrean dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat Versi TPU.
runtime-version
- Versi software Cloud TPU.
validInterval
- Waktu selama permintaan valid, setelah itu permintaan akan dibatalkan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat Google Cloud CLI topic datetime.
metadata-from-file
- Menentukan file yang berisi metadata. Jika Anda tidak menentukan jalur yang sepenuhnya memenuhi syarat ke file metadata, perintah akan menganggapnya berada di direktori saat ini. Dalam contoh ini, file berisi skrip startup yang dijalankan saat resource dalam antrean disediakan.
metadata
- Menentukan metadata untuk permintaan. Dalam contoh ini, metadata adalah perintah skrip startup yang dijalankan saat resource dalam antrean disediakan.
curl
Saat menggunakan curl
, Anda harus menyertakan kode skrip dalam konten JSON.
Contoh berikut menyertakan skrip inline di isi JSON.
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ tpu: { node_spec: { parent: 'projects/your-project-number/locations/us-central1-a', node_id: 'your-node-id', node: { accelerator_type: 'v5e-8', runtime_version: 'v2-alpha-tpuv5-lite', metadata: { "startup-script": "#! /bin/bash\npwd > /tmp/out.txt\nwhoami >> /tmp/out.txt" } } } }, 'queueing_policy': { 'validInterval': { 'startTime': '2022-12-10T14:30:00Z', 'endTime': '2022-12-14T09:00:00Z' } }, }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central1-a/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi tanda perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID yang ditentukan pengguna dari TPU yang dibuat sebagai respons terhadap permintaan.
project
- ID project tempat resource dalam antrean dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat Versi TPU.
runtime-version
- Versi software Cloud TPU.
validInterval
- Waktu selama permintaan valid, setelah itu permintaan akan dibatalkan. Untuk mengetahui informasi selengkapnya tentang format durasi, lihat Google Cloud CLI topic datetime.
metadata-from-file
- Menentukan file yang berisi metadata. Jika Anda tidak menentukan jalur yang sepenuhnya memenuhi syarat ke file metadata, perintah akan menganggapnya berada di direktori saat ini. Dalam contoh ini, file berisi skrip startup yang dijalankan saat resource dalam antrean disediakan.
metadata
- Menentukan metadata untuk permintaan. Dalam contoh ini, metadata adalah perintah skrip startup yang dijalankan saat resource dalam antrean disediakan.
Java
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Meminta resource dalam antrean dengan jaringan dan subnetwork tertentu
Dalam permintaan resource yang diantrekan, Anda dapat menentukan jaringan dan subnetwork yang ingin Anda gunakan untuk menghubungkan TPU.
gcloud
gcloud compute tpus queued-resources create your-queued-resource-id \ --node-id your-node-id \ --project your-project-id \ --zone us-central1-a \ --accelerator-type v5e-8 \ --runtime-version v2-alpha-tpuv5-lite \ --network network-name \ --subnetwork subnetwork-name
Deskripsi parameter perintah
queued-resource-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID yang ditetapkan pengguna untuk TPU yang dibuat saat permintaan resource dalam antrean dialokasikan.
project
- Project Google Cloud Anda.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat Versi TPU.
runtime-version
- Versi software Cloud TPU.
reserved
- Gunakan tanda ini saat meminta resource dalam antrean sebagai bagian dari reservasi Cloud TPU.
network
- Jaringan tempat resource yang diantrekan akan menjadi bagiannya.
subnetwork
- Subnetwork yang akan menjadi bagian dari resource dalam antrean.
curl
curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -d "{ 'tpu': { 'node_spec': { 'parent': 'projects/your-project-number/locations/us-central1-a', 'node_id': 'your-node-id', 'node': { 'accelerator_type': 'v5e-8', 'runtime_version': 'v2-alpha-tpuv5-lite', 'network_config': { 'network': 'network-name', 'subnetwork': 'subnetwork-name', 'enable_external_ips': true } } }, 'guaranteed': { 'reserved': true, } }" \ https://tpu.googleapis.com/v2alpha1/projects/your-project-id/locations/us-central1-a/queuedResources?queued_resource_id=your-queued-resource-id
Deskripsi parameter perintah
queued-resource-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
node-id
- ID yang ditetapkan pengguna untuk TPU yang dibuat saat permintaan resource dalam antrean dialokasikan.
project
- Project Google Cloud Anda.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
accelerator-type
- Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat Versi TPU.
runtime-version
- Versi software Cloud TPU.
reserved
- Gunakan tanda ini saat meminta resource dalam antrean sebagai bagian dari reservasi Cloud TPU.
network
- Jaringan tempat resource yang diantrekan akan menjadi bagiannya.
subnetwork
- Subnetwork yang akan menjadi bagian dari resource dalam antrean.
Konsol
Di konsol Google Cloud , buka halaman TPU:
Klik Buat TPU.
Di kolom Name, masukkan nama untuk TPU Anda.
Di kotak Zone, pilih zona tempat Anda ingin membuat TPU.
Di kotak TPU type, pilih jenis akselerator. Jenis akselerator menentukan versi dan ukuran Cloud TPU yang ingin Anda buat. Untuk mengetahui informasi selengkapnya tentang jenis akselerator yang didukung untuk setiap versi TPU, lihat versi TPU.
Di kotak Versi software TPU, pilih versi software. Saat membuat VM Cloud TPU, versi software TPU menentukan versi runtime TPU yang akan diinstal. Untuk mengetahui informasi selengkapnya, lihat Versi software TPU.
Klik tombol Aktifkan antrean.
Di kolom Queued resource name, masukkan nama untuk permintaan resource yang diantrekan.
Luaskan bagian Network.
Di kolom Network dan Subnetwork, pilih jaringan dan subnetwork yang ingin Anda gunakan.
Klik Buat untuk membuat permintaan resource dalam antrean.
Java
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Menghapus permintaan resource dalam antrean
Anda dapat menghapus permintaan resource dalam antrean dan TPU yang terkait dengan permintaan tersebut dengan menghapus permintaan resource dalam antrean:
gcloud
Teruskan flag --force
ke perintah queued-resource delete
:
gcloud compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central1-a \ --force \ --async
Deskripsi tanda perintah
your-queued-resource-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
project
- Project Google Cloud tempat resource dalam antrean dialokasikan.
zone
- Zona Cloud TPU yang akan dihapus.
force
- Hapus TPU VM dan permintaan resource yang diantrekan.
curl
Gunakan parameter kueri force=true
dalam permintaan curl
Anda:
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central1-a/queuedResources/your-queued-resource-id?force=true
Deskripsi tanda perintah
your-queued-resource-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
project
- Project Google Cloud tempat resource dalam antrean dialokasikan.
zone
- Zona Cloud TPU yang akan dihapus.
force
- Hapus TPU VM dan permintaan resource yang diantrekan.
Konsol
Di konsol Google Cloud , buka halaman TPU:
Klik tab Sumber daya dalam antrean.
Centang kotak di samping permintaan resource yang diantrekan.
Klik
Delete.
Java
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Jika Anda menghapus TPU secara langsung, Anda juga perlu menghapus resource yang diantrekan, seperti yang ditunjukkan dalam contoh berikut. Saat Anda menghapus TPU, permintaan resource yang diantrekan akan bertransisi ke status SUSPENDED
, setelah itu permintaan resource yang diantrekan dapat dihapus.
gcloud
Hapus TPU:
$ gcloud compute tpus tpu-vm delete your-node-id \ --project=your-project-id \ --zone=us-central1-a \ --quiet
Deskripsi tanda perintah
project
- Project Google Cloud tempat resource dalam antrean dialokasikan.
zone
- Zona Cloud TPU yang akan dihapus.
your-node-id
- Nama TPU yang ingin Anda hapus.
Saat Anda menghapus TPU, resource dalam antrean yang terkait akan masuk ke status
SUSPENDING
, lalu status SUSPENDED
. Saat resource yang diantrekan berada dalam status SUSPENDED
, Anda dapat menghapusnya:
gcloud compute tpus queued-resources delete your-queued-resource-id \ --project your-project-id \ --zone us-central1-a
Deskripsi tanda perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
project
- Project Google Cloud tempat resource dalam antrean dialokasikan.
zone
- Zona Cloud TPU yang akan dihapus.
curl
Hapus TPU:
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project/locations/us-central1-a/nodes?node_id=your-node-id
Deskripsi tanda perintah
project
- Project Google Cloud tempat resource dalam antrean dialokasikan.
zone
- Zona Cloud TPU yang akan dihapus.
your-node-id
- Nama TPU yang ingin Anda hapus.
Saat Anda menghapus TPU, resource dalam antrean yang terkait akan masuk ke status
SUSPENDING
, lalu status SUSPENDED
. Saat resource yang diantrekan berada dalam status SUSPENDED
, Anda dapat menghapusnya:
curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central1-a/queuedResources/your-queued-resource-id
Deskripsi tanda perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
project
- Project Google Cloud tempat resource dalam antrean dialokasikan.
zone
- Zona Cloud TPU yang akan dihapus.
Konsol
Menghapus TPU:
Di konsol Google Cloud , buka halaman TPU:
Centang kotak di samping TPU Anda.
Klik
Delete.
Saat Anda menghapus TPU, resource dalam antrean yang terkait akan memasuki status Suspending, lalu status Suspended. Jika resource dalam antrean Anda berada dalam status Ditangguhkan, Anda dapat menghapusnya:
- Klik tab Sumber daya dalam antrean.
- Centang kotak di samping permintaan resource yang diantrekan.
- Klik Delete.
Java
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Saat Anda menghapus TPU, resource dalam antrean yang terkait akan masuk ke status
SUSPENDING
, lalu status SUSPENDED
. Saat resource dalam antrean Anda berada dalam status SUSPENDED
, Anda dapat menghapusnya:
Python
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Saat Anda menghapus TPU, resource dalam antrean yang terkait akan masuk ke status
SUSPENDING
, lalu status SUSPENDED
. Saat resource dalam antrean Anda berada dalam status SUSPENDED
, Anda dapat menghapusnya:
Mengambil informasi diagnostik dan status tentang permintaan resource yang diantrekan
Mengambil informasi diagnostik dan status tentang permintaan resource yang diantrekan:
gcloud
gcloud compute tpus queued-resources describe queued-resource-request-id \ --project your-project-id \ --zone us-central1-a
Deskripsi tanda perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
project
- ID project tempat resource dalam antrean dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/us-central1-a/queuedResources/your-queued-resource-id
Deskripsi tanda perintah
queued-resource-request-id
- ID yang ditetapkan pengguna untuk permintaan resource yang diantrekan.
project
- ID project tempat resource dalam antrean dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
Konsol
Di konsol Google Cloud , buka halaman TPU:
Klik tab Sumber daya dalam antrean.
Klik nama permintaan resource yang diantrekan.
Setelah TPU Anda disediakan, Anda juga dapat melihat detail tentang permintaan resource yang diantrekan dengan membuka halaman TPU, menemukan TPU Anda, dan mengklik nama permintaan resource yang diantrekan yang sesuai.
Java
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Jika permintaan gagal, output akan berisi informasi error. Untuk permintaan yang sedang menunggu resource, outputnya akan terlihat mirip dengan berikut ini:
gcloud
name: projects/your-project-id/locations/us-central1-a/queuedResources/your-queued-resource-id state: state: WAITING_FOR_RESOURCES tpu: nodeSpec: - node: acceleratorType: v4-8 bootDisk: {} networkConfig: enableExternalIps: true queuedResource: projects/your-project-number/locations/us-central1-a/queuedResources/your-queued-resource-id runtimeVersion: v2-alpha-tpuv5-lite schedulingConfig: {} serviceAccount: {} shieldedInstanceConfig: {} useTpuVm: true nodeId: your-node-id parent: projects/your-project-number/locations/us-central1-a
Konsol
Kolom Status resource dalam antrean menampilkan Menunggu resource.
Mencantumkan permintaan resource yang diantrekan dalam project Anda
Mencantumkan permintaan resource yang diantrekan di project Anda:
gcloud
gcloud compute tpus queued-resources list --project your-project-id \ --zone us-central1-a
Deskripsi tanda perintah
project
- Project Google Cloud tempat resource dalam antrean dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
curl
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ https://tpu.googleapis.com/v2/projects/your-project-id/locations/your-zone/queuedResources
Deskripsi tanda perintah
project
- Project Google Cloud tempat resource dalam antrean dialokasikan.
zone
- Zona tempat Anda berencana membuat Cloud TPU.
Konsol
Di konsol Google Cloud , buka halaman TPU:
Klik tab Sumber daya dalam antrean.
Java
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk melakukan autentikasi ke Cloud TPU, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan autentikasi untuk lingkungan pengembangan lokal.