Menjalankan pipeline machine learning

Pipeline AI Platform menyediakan platform yang dapat Anda gunakan untuk mengotomatiskan alur kerja machine learning (ML) Anda sebagai pipeline. Dengan menjalankan proses ML sebagai pipeline, Anda dapat:

  • Menjalankan pipeline sesuai kebutuhan.
  • Menjadwalkan proses berulang untuk melatih kembali model Anda secara rutin.
  • Lakukan eksperimen dengan menjalankan pipeline menggunakan kumpulan hyperparameter yang berbeda, jumlah langkah pelatihan atau iterasi, dll. Kemudian, bandingkan hasil eksperimen Anda.

Panduan ini menjelaskan cara menjalankan pipeline dan menjadwalkan operasi berulang. Panduan ini juga menyediakan referensi yang dapat Anda gunakan untuk mempelajari antarmuka pengguna Kubeflow Pipelines lebih lanjut.

Sebelum memulai

Panduan ini menjelaskan cara menggunakan antarmuka pengguna Kubeflow Pipelines untuk menjalankan pipeline. Sebelum dapat menjalankan pipeline, Anda harus menyiapkan cluster AI Platform Pipelines dan memastikan Anda memiliki izin yang memadai untuk mengakses cluster Pipeline AI Platform.

Menjalankan pipeline ML

Gunakan petunjuk berikut untuk menjalankan pipeline ML di cluster AI Platform Pipelines Anda.

  1. Buka AI Platform Pipelines di Konsol Google Cloud.

    Buka AI Platform Pipelines

  2. Klik Open pipelines dashboard untuk cluster Kubeflow Pipelines Anda. Antarmuka pengguna Kubeflow Pipelines akan terbuka di tab baru.

  3. Di panel navigasi kiri, klik Pipeline.

  4. Klik nama pipeline yang ingin Anda jalankan. Jika Anda belum memuat pipeline, klik nama pipeline contoh, seperti [Demo] TFX - Taxi Tip Prediction Model Trainer. Grafik yang menampilkan langkah-langkah dalam pipeline akan terbuka.

  5. Untuk menjalankan atau menjadwalkan pipeline, klik Create run. Formulir tempat Anda dapat memasukkan detail operasi akan terbuka.

  6. Sebelum menjalankan pipeline, Anda harus menentukan detail run, jenis run, dan parameter yang dijalankan.

    • Di bagian Run details, tentukan hal berikut:

      1. Pipeline: Pilih pipeline yang ingin Anda jalankan.
      2. Pipeline Version: Pilih versi pipeline yang ingin dijalankan.
      3. Nama run: Masukkan nama unik untuk operasi ini. Anda dapat menggunakan nama ini untuk menemukan operasi ini nanti.
      4. Deskripsi: (Opsional) Masukkan deskripsi untuk memberikan informasi selengkapnya tentang operasi ini.
      5. Eksperimen: (Opsional) Untuk mengelompokkan operasi terkait, pilih eksperimen.
    • Di bagian Run type, tunjukkan seberapa sering operasi ini harus dieksekusi.

      1. Pilih apakah ini adalah proses Satu kali atau Berulang.
      2. Jika ini adalah proses berulang, tentukan pemicu eksekusi:

        1. Jenis pemicu: Pilih jika proses ini dipicu secara berkala, atau berdasarkan jadwal cron.
        2. Operasi serentak maksimum: Masukkan jumlah maksimum operasi yang dapat aktif pada satu waktu.
        3. Memiliki tanggal mulai: Centang Memiliki tanggal mulai, lalu masukkan Tanggal mulai dan Waktu mulai untuk menentukan kapan pemicu ini harus mulai dijalankan.
        4. Memiliki tanggal akhir: Periksa Memiliki tanggal akhir, lalu masukkan Tanggal akhir dan Waktu berakhir untuk menentukan kapan pemicu ini harus berhenti membuat operasi.
        5. Jalankan setiap: Pilih frekuensi untuk memicu operasi baru. Jika proses ini dipicu berdasarkan jadwal cron, centang Izinkan pengeditan ekspresi cron untuk memasukkan ekspresi cron secara langsung.
    • Di bagian Parameter run, sesuaikan parameter pipeline untuk operasi ini. Anda dapat menggunakan parameter untuk menetapkan nilai seperti jalur untuk memuat data pelatihan atau menyimpan artefak, hyperparameter, jumlah iterasi pelatihan, dll. Parameter pipeline ditentukan saat pipeline dibuat.

      Jika Anda menjalankan pipeline [Demo] TFX - Taxi Tip Prediction Model Trainer, tentukan hal-hal berikut:

      1. pipeline-root: Parameter pipeline-root menentukan tempat output pipeline harus disimpan. Pipeline ini menyimpan artefak jalan ke bucket Cloud Storage default AI Platform Pipelines.

        Anda dapat mengganti nilai ini untuk menentukan jalur ke bucket Cloud Storage lain yang dapat diakses oleh cluster Anda. Pelajari cara membuat bucket Cloud Storage lebih lanjut.

      2. data-root: Parameter data-root menentukan jalur ke data pelatihan pipeline. Gunakan nilai default.

      3. module-file: Parameter module-file menetapkan jalur ke kode sumber untuk modul yang digunakan dalam pipeline ini. Gunakan nilai default.

        Dengan memuat kode dari bucket Cloud Storage, Anda dapat mengubah perilaku komponen dengan cepat tanpa mem-build ulang image container komponen.

  7. Klik Start. Dasbor pipeline menampilkan daftar operasi pipeline.

  8. Klik nama operasi Anda dalam daftar operasi pipeline. Grafik lari Anda akan ditampilkan. Saat sesi lari masih berlangsung, grafik akan berubah saat setiap langkah dijalankan.

  9. Klik langkah-langkah pipeline untuk mempelajari input, output, log, dll.

Memahami antarmuka pengguna Kubeflow Pipelines

Gunakan referensi berikut untuk mempelajari antarmuka pengguna Kubeflow Pipelines lebih lanjut.

Langkah selanjutnya