Halaman ini diterjemahkan oleh Cloud Translation API.

Men-deploy model menggunakan konsol Google Cloud

Di Google Cloud konsol, Anda dapat membuat endpoint publik dan men-deploy model ke endpoint tersebut.

Model dapat di-deploy dari halaman Prediksi online atau halaman Model Registry.

Men-deploy model dari halaman Prediksi online

Di halaman Prediksi online, Anda dapat membuat endpoint dan men-deploy satu atau beberapa model ke endpoint tersebut sebagai berikut:

Di konsol Google Cloud , di bagian Vertex AI, buka halaman Online prediction.

Buka halaman Prediksi online
Klik Create.
Di panel Endpoint baru:
1. Masukkan Nama endpoint.
2. Pilih Standar untuk jenis akses.
3. Untuk membuat endpoint publik khusus (tidak dibagikan), centang kotak Aktifkan DNS khusus.
4. Klik Lanjutkan.
Di panel Setelan model:
1. Pilih model Anda dari menu drop-down.
2. Pilih versi model dari menu drop-down.
3. Masukkan persentase Pemisahan traffic untuk model.
4. Klik Selesai.
5. Ulangi langkah-langkah ini untuk model tambahan yang akan di-deploy.

Men-deploy model dari halaman Model Registry

Di halaman Model Registry, Anda dapat men-deploy model ke satu atau beberapa endpoint baru atau yang sudah ada sebagai berikut:

Di konsol Google Cloud , di bagian Vertex AI, buka halaman Model.

Buka halaman Model
Klik nama dan ID versi model yang ingin Anda deploy untuk membuka halaman detailnya.
Pilih tab Deploy & Uji.

Jika model Anda sudah di-deploy ke endpoint, model tersebut akan tercantum di bagian Deploy model Anda.
Klik Deploy to endpoint.
Untuk men-deploy model ke endpoint baru:
1. Pilih Create new endpoint
2. Berikan nama untuk endpoint baru.
3. Untuk membuat endpoint publik khusus (tidak dibagikan), centang kotak Aktifkan DNS khusus.
4. Klik Lanjutkan.
Untuk men-deploy model ke endpoint yang ada:
1. Pilih Tambahkan ke endpoint yang ada.
2. Pilih endpoint dari menu drop-down.
3. Klik Lanjutkan.
Anda dapat men-deploy beberapa model ke satu endpoint, atau men-deploy model yang sama ke beberapa endpoint.
Jika Anda men-deploy model ke endpoint yang sudah ada dan satu atau beberapa beberapa model telah di-deploy ke endpoint tersebut, Anda harus memperbarui persentase Pemisahan traffic untuk model yang sedang di-deploy dan yang telah di-deploy sehingga jumlah semua persentasenya menjadi 100%.
Jika Anda men-deploy model ke endpoint baru, terima nilai 100 untuk Pemisahan traffic. Jika tidak, sesuaikan nilai pemisahan traffic untuk semua model di endpoint sehingga jumlahnya menjadi 100.
Masukkan Jumlah minimum node komputasi yang ingin Anda berikan untuk model Anda.

Ini adalah jumlah node yang harus selalu tersedia untuk model.

Anda akan dikenai biaya untuk node yang digunakan, baik untuk menangani beban inferensi maupun untuk node standby (minimum) meskipun tanpa traffic inferensi. Lihat halaman harga.

Jumlah node komputasi dapat meningkat jika diperlukan untuk menangani traffic inferensi, tetapi tidak akan pernah melebihi jumlah maksimum node.
Untuk menggunakan penskalaan otomatis, masukkan Jumlah maksimum node komputasi yang ingin Anda tingkatkan skalanya menggunakan Vertex AI.
Pilih Jenis mesin.

Resource mesin yang lebih besar akan meningkatkan performa inferensi dan meningkatkan biaya. Bandingkan jenis mesin yang tersedia.
Pilih Jenis akselerator dan Jumlah akselerator.

Jika Anda mengaktifkan penggunaan akselerator saat mengimpor atau membuat model, opsi ini akan ditampilkan.

Untuk mengetahui jumlah akselerator, lihat tabel GPU untuk memeriksa jumlah GPU valid yang dapat Anda gunakan dengan setiap jenis mesin CPU. Jumlah akselerator mengacu pada jumlah akselerator per node, bukan total jumlah akselerator dalam deployment Anda.
Jika Anda ingin menggunakan akun layanan kustom untuk deployment, pilih akun layanan di kotak drop-down Akun layanan.
Pelajari cara mengubah setelan default untuk logging inferensi.
Klik Selesai untuk model Anda, dan jika semua persentase Pemisahan traffic sudah benar, klik Lanjutkan.
Region tempat model Anda men-deploy ditampilkan. Area ini harus menjadi region tempat Anda membuat model.
Klik Deploy untuk men-deploy model Anda ke endpoint.

Langkah berikutnya

Pelajari cara mendapatkan inferensi online.
Pelajari cara mengubah setelan default untuk logging inferensi.

Men-deploy model menggunakan konsol Google Cloud Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

Men-deploy model dari halaman Prediksi online

Men-deploy model dari halaman Model Registry

Langkah berikutnya

Men-deploy model menggunakan konsol Google Cloud