Membandingkan pelatihan kustom Vertex AI dan Ray di Vertex AI
Vertex AI menawarkan dua opsi untuk pelatihan kustom, yaitu pelatihan kustom Vertex AI dan Ray di Vertex AI. Halaman ini memberikan konteks untuk membantu memilih antara kedua opsi ini.
Vertex AI Training | Ray di Vertex AI | |
---|---|---|
Fokus | Pelatihan model kustom serbaguna. | Menskalakan aplikasi AI dan Python, termasuk pelatihan model, aplikasi terdistribusi, dan inferensi model. |
Framework dasar | Mendukung berbagai framework ML: misalnya, TensorFlow, PyTorch, scikit-learn. | Memanfaatkan framework Ray open source. Mendukung berbagai framework: TensorFlow, PyTorch, scikit-learn, dan Spark di Ray menggunakan RayDP). |
Fleksibilitas | Fleksibilitas tinggi dalam hal kode dan lingkungan. | Fleksibilitas tinggi untuk membangun aplikasi terdistribusi; dapat menggunakan kode Ray yang ada dengan sedikit perubahan. |
Skalabilitas | Mendukung pelatihan terdistribusi di beberapa mesin. Menawarkan resource komputasi yang skalabel (CPU, GPU, TPU). | Dirancang untuk skalabilitas tinggi menggunakan kemampuan komputasi terdistribusi Ray (hingga 2.000 node). Mendukung penskalaan manual dan otomatis. |
Integrasi | Terintegrasi dengan layanan Vertex AI lainnya (Set Data, Vertex AI Experiments, dan lainnya). | Terintegrasi dengan layanan Google Cloud lainnya seperti Inferensi Vertex AI dan BigQuery. |
Kemudahan penggunaan | Lebih mudah digunakan untuk paradigma pelatihan terdistribusi standar. | Memerlukan pemahaman tentang konsep framework Ray. |
Lingkungan | Lingkungan terkelola untuk menjalankan kode pelatihan kustom menggunakan container bawaan atau kustom. | Lingkungan terkelola untuk menjalankan aplikasi terdistribusi menggunakan framework Ray; menyederhanakan pengelolaan cluster Ray di Vertex AI. |
Penyesuaian hyperparameter | Mencakup kemampuan penyesuaian hyperparameter. | Menyederhanakan penyesuaian hyperparameter dengan alat untuk pengoptimalan yang efisien dan pengelolaan eksperimen. |
Pipeline pelatihan | Mendukung alur kerja ML yang kompleks dengan beberapa langkah. | Tidak berlaku. |
Perbedaan utama antara pelatihan kustom Vertex AI dan Ray di Vertex AI
Pelatihan kustom Vertex AI adalah layanan yang lebih luas yang mengelola berbagai metode pelatihan, sedangkan Ray di Vertex AI secara khusus menggunakan framework komputasi terdistribusi Ray.
Vertex AI Training | Ray di Vertex AI | |
---|---|---|
Fokus | Terutama berfokus pada pengembangan dan pelatihan model. Mengelola berbagai metode pelatihan. | Dirancang untuk aplikasi Python terdistribusi serbaguna, termasuk pemrosesan data, penyajian model, dan penskalaan pelatihan. |
Framework dasar | Terikat dengan kemampuan terdistribusi dari framework ML tertentu (misalnya, TensorFlow, PyTorch). | Menggunakan Ray sebagai framework komputasi terdistribusi pusat. Menangani distribusi tugas terlepas dari framework ML pokok yang digunakan dalam tugas Ray. |
Konfigurasi resource | Mengonfigurasi resource untuk tugas pelatihan individual. | Mengelola cluster Ray di cluster Vertex AI; Ray menangani distribusi tugas dalam cluster. |
Konfigurasi distribusi | Konfigurasi jumlah dan jenis replika untuk tugas pelatihan tertentu. | Konfigurasi ukuran dan komposisi cluster Ray on Vertex AI; penjadwal Ray secara dinamis mendistribusikan tugas dan aktor di seluruh node yang tersedia. |
Cakupan distribusi | Umumnya berfokus pada satu tugas pelatihan yang berpotensi berjalan lama. | Menyediakan lingkungan komputasi terdistribusi yang lebih persisten dan serbaguna tempat Anda dapat menjalankan beberapa tugas dan aplikasi terdistribusi selama siklus proses cluster Ray. |
Ringkasan
Jika Anda perlu menggunakan kemampuan komputasi terdistribusi dengan framework Ray dalam lingkungan Google Cloud , Ray on Vertex AI adalah layanan yang harus digunakan. Ray di Vertex AI dapat dianggap sebagai alat tertentu dalam ekosistem Vertex AI yang lebih besar, terutama berguna untuk workload terdistribusi dan sangat skalabel.
Jika Anda memerlukan platform terkelola yang lebih serbaguna untuk berbagai pendekatan pelatihan model, termasuk opsi otomatis, eksekusi kode kustom, dan penyesuaian hyperparameter, layanan pelatihan kustom Vertex AI yang lebih luas akan berguna.