Mempelajari prediksi online

Vertex AI menawarkan prediksi online di Google Distributed Cloud (GDC) yang terisolasi melalui Online Prediction API. Prediksi adalah output dari model machine learning yang telah dilatih. Secara khusus, prediksi online adalah permintaan sinkron yang dibuat ke endpoint model Anda.

Prediksi Online memungkinkan Anda mengupload, men-deploy, menyajikan, dan membuat permintaan menggunakan model prediksi Anda sendiri di sekumpulan container yang didukung. Gunakan Prediksi Online saat membuat permintaan sebagai respons terhadap input aplikasi atau dalam situasi yang memerlukan inferensi tepat waktu.

Anda dapat menggunakan Online Prediction API dengan menerapkan resource kustom Kubernetes ke cluster prediksi khusus yang dibuat oleh Operator Infrastruktur (IO) untuk Anda.

Sebelum mendapatkan prediksi online, Anda harus mengekspor artefak model dan men-deploy model ke endpoint. Tindakan ini mengaitkan resource komputasi dengan model untuk menyajikan prediksi online dengan latensi rendah.

Kemudian, Anda bisa mendapatkan prediksi online dari model yang dilatih secara khusus dengan memformat dan mengirim permintaan.

Image container yang tersedia

Tabel berikut berisi daftar penampung yang didukung untuk Prediksi Online di Distributed Cloud:

Framework ML Versi Akselerator yang didukung Image yang didukung
TensorFlow 2.14 CPU tf2-cpu.2-14
GPU tf2-gpu.2-14
PyTorch 2,4 CPU pytorch-cpu.2-4
GPU pytorch-gpu.2-4
2.1 (TIDAK DIGUNAKAN LAGI) CPU pytorch-cpu.2-1
GPU pytorch-gpu.2-1