Menggunakan Apache Beam untuk membuat pipeline

Dataflow dibuat berdasarkan project Apache Beam open source. Anda dapat menggunakan Apache Beam SDK untuk mem-build pipeline untuk Dataflow. Dokumen ini mencantumkan beberapa referensi untuk memulai pemrograman Apache Beam.

Mulai

  • Menginstal Apache Beam SDK: Menunjukkan cara menginstal Apache Beam SDK sehingga Anda dapat menjalankan pipeline di Dataflow.

  • Membuat pipeline Java: Menunjukkan cara membuat pipeline dengan Apache Beam Java SDK dan menjalankan pipeline di Dataflow.

  • Membuat pipeline Python: Menunjukkan cara membuat pipeline dengan Apache Beam Python SDK dan menjalankan pipeline di Dataflow.

  • Membuat pipeline Go: Menunjukkan cara membuat pipeline dengan Apache Beam Go SDK dan menjalankan pipeline di Dataflow.

Mempelajari Apache Beam

Anda dapat menggunakan halaman berikut di situs Apache Beam untuk mempelajari pemrograman Apache Beam.

  • Panduan pemrograman Apache Beam: Memberikan panduan untuk menggunakan class Apache Beam SDK guna mem-build dan menguji pipeline Anda.

  • Tur Apache Beam: Panduan pembelajaran yang dapat Anda gunakan untuk memahami Apache Beam. Unit pembelajaran disertai dengan contoh kode yang dapat Anda jalankan dan ubah.

  • Apache Beam playground: Lingkungan interaktif untuk mencoba transformasi dan contoh Apache Beam tanpa harus menginstal Apache Beam di lingkungan Anda.

  • Membuat pipeline: Menjelaskan mekanisme penggunaan class di Apache Beam SDK dan langkah-langkah yang diperlukan untuk membuat pipeline.

Mengembangkan pipeline

Contoh kode

Anda dapat menggunakan contoh berikut dari GitHub Apache Beam untuk mulai mem-build pipeline streaming:

Langkah berikutnya