Jika Anda menulis kode pelatihan sendiri alih-alih menggunakan AutoML, ada beberapa cara untuk melakukan pelatihan kustom yang perlu dipertimbangkan. Topik ini memberikan ringkasan singkat dan perbandingan terkait berbagai cara menjalankan pelatihan kustom.
Resource pelatihan kustom di Vertex AI
Ada tiga jenis resource Vertex AI yang dapat Anda buat untuk melatih model kustom di Vertex AI:
Saat membuat tugas kustom, Anda menentukan setelan yang diperlukan Vertex AI untuk menjalankan kode pelatihan Anda, termasuk:
- Satu pool worker untuk pelatihan node tunggal (
WorkerPoolSpec
), atau beberapa kumpulan worker untuk pelatihan yang terdistribusi - Setelan opsional untuk mengonfigurasi penjadwalan tugas (
Scheduling
), menetapkan variabel lingkungan tertentu untuk kode pelatihan Anda, menggunakan akun layanan khusus, dan menggunakan Peering Jaringan VPC.
Dalam kumpulan worker, Anda dapat menentukan setelan berikut:
- Jenis mesin dan akselerator
- Konfigurasi jenis kode pelatihan yang dijalankan oleh
kumpulan worker: aplikasi
pelatihan Python (
PythonPackageSpec
) atau container kustom (ContainerSpec
)
Tugas penyesuaian hyperparameter memiliki setelan tambahan yang perlu dikonfigurasi, seperti metrik. Pelajari lebih lanjut penyesuaian hyperparameter.
Pipeline pelatihan mengatur tugas pelatihan kustom atau tugas penyesuaian hyperparameter dengan langkah-langkah tambahan, seperti memuat set data atau mengupload model ke Vertex AI setelah tugas pelatihan berhasil diselesaikan.
Resource pelatihan kustom
Untuk melihat pipeline pelatihan yang ada dalam project Anda, buka halaman Pipeline Pelatihan di bagian Vertex AI pada konsol Google Cloud.
Untuk melihat tugas kustom yang ada di project Anda, buka halaman Tugas kustom.
Untuk melihat tugas penyesuaian hyperparameter yang ada di project Anda, buka halaman Penyesuaian hyperparameter.
Buka Penyesuaian hyperparameter
Container kustom dan bawaan
Sebelum mengirim tugas pelatihan kustom, tugas penyesuaian hyperparameter, atau pipeline pelatihan ke Vertex AI, Anda harus membuat aplikasi pelatihan Python atau container kustom untuk menentukan kode pelatihan dan dependensi yang ingin Anda jalankan di Vertex AI. Jika membuat aplikasi pelatihan Python menggunakan TensorFlow, PyTorch, scikit-learn, atau XGBoost, Anda dapat menggunakan container bawaan kami untuk menjalankan kode Anda. Jika Anda tidak yakin opsi mana yang harus dipilih, lihat persyaratan kode pelatihan untuk mempelajari lebih lanjut.
Pelatihan terdistribusi
Anda dapat mengonfigurasi tugas pelatihan kustom, tugas penyesuaian hyperparameter, atau pipeline pelatihan untuk pelatihan terdistribusi dengan menentukan beberapa kumpulan worker:
- Gunakan kumpulan worker pertama Anda untuk mengonfigurasi replika utama, dan tetapkan jumlah replika ke 1.
- Tambahkan lebih banyak pool worker untuk mengonfigurasi replika worker, replika server parameter, atau replika evaluator, jika framework machine learning Anda mendukung tugas cluster tambahan ini untuk pelatihan terdistribusi.
Pelajari lebih lanjut cara menggunakan pelatihan terdistribusi.
Langkah selanjutnya
- Mempelajari cara membuat resource persisten untuk menjalankan tugas pelatihan kustom.
- Membaca artikel Membuat tugas pelatihan kustom untuk mempelajari cara membuat tugas pelatihan kustom guna menjalankan aplikasi pelatihan kustom di Vertex AI.
- Membaca artikel Membuat pipeline pelatihan untuk mempelajari cara membuat pipeline pelatihan guna menjalankan aplikasi pelatihan kustom di Vertex AI.
- Membaca artikel Menggunakan penyesuaian hyperparameter untuk mempelajari Penelusuran penyesuaian hyperparameter.