Halaman ini diterjemahkan oleh Cloud Translation API.

Mempelajari prediksi online

Vertex AI menawarkan prediksi online di Google Distributed Cloud (GDC) yang terisolasi melalui Online Prediction API. Prediksi adalah output dari model machine learning yang telah dilatih. Secara khusus, prediksi online adalah permintaan sinkron yang dibuat ke endpoint model Anda.

Prediksi Online memungkinkan Anda mengupload, men-deploy, menyajikan, dan membuat permintaan menggunakan model prediksi Anda sendiri di sekumpulan container yang didukung. Gunakan Prediksi Online saat membuat permintaan sebagai respons terhadap input aplikasi atau dalam situasi yang memerlukan inferensi tepat waktu.

Anda dapat menggunakan Online Prediction API dengan menerapkan resource kustom Kubernetes ke cluster prediksi khusus yang dibuat oleh Operator Infrastruktur (IO) untuk Anda.

Sebelum mendapatkan prediksi online, Anda harus mengekspor artefak model dan men-deploy model ke endpoint. Tindakan ini mengaitkan resource komputasi dengan model untuk menyajikan prediksi online dengan latensi rendah.

Kemudian, Anda bisa mendapatkan prediksi online dari model yang dilatih secara khusus dengan memformat dan mengirim permintaan.

Image container yang tersedia

Tabel berikut berisi daftar penampung yang didukung untuk Prediksi Online di Distributed Cloud:

Framework ML	Versi	Akselerator yang didukung	Image yang didukung
TensorFlow	2.14	CPU	tf2-cpu.2-14
TensorFlow	2.14	GPU	tf2-gpu.2-14
PyTorch	2,4	CPU	pytorch-cpu.2-4
	2,4	GPU	pytorch-gpu.2-4
	2.1 (TIDAK DIGUNAKAN LAGI)	CPU	pytorch-cpu.2-1
	2.1 (TIDAK DIGUNAKAN LAGI)	GPU	pytorch-gpu.2-1