Panduan memulai ini memandu Anda dalam menginstal Google Cloud Pipeline Components (GCPC) SDK.
Menginstal rilis terbaru
Gunakan perintah berikut untuk menginstal Google Cloud SDK dari Python Package Index (PyPI):
pip install --upgrade google-cloud-pipeline-components
Mengimpor komponen bawaan menggunakan Google Cloud SDK
Setelah menginstal Google Cloud SDK, Anda dapat menggunakannya untuk mengimpor komponen siap pakai.
Untuk mengetahui informasi referensi SDK tentang komponen yang didukung, lihat dokumentasiGoogle Cloud SDK.
Misalnya, Anda dapat menggunakan kode berikut untuk mengimpor dan menggunakan komponen Dataflow di pipeline.
from google_cloud_pipeline_components.v1.dataflow import DataflowPythonJobOp
from kfp import dsl
@dsl.pipeline(
name=PIPELINE_NAME,
description='Dataflow launch python pipeline'
)
def pipeline(
python_file_path:str = 'gs://ml-pipeline-playground/samples/dataflow/wc/wc.py',
project_id:str = PROJECT_ID,
location:str = LOCATION,
staging_dir:str = PIPELINE_ROOT,
requirements_file_path:str = 'gs://ml-pipeline-playground/samples/dataflow/wc/requirements.txt',
):
dataflow_python_op = DataflowPythonJobOp(
project=project_id,
location=location,
python_module_path=python_file_path,
temp_location = staging_dir,
requirements_file_path = requirements_file_path,
args = ['--output', OUTPUT_FILE],
)
Langkah berikutnya
- Baca Pengantar Google Cloud Komponen Pipeline.
- Lihat semua tutorial yang menggunakan
google_cloud_pipeline_components
SDK. - Memulai dengan Komponen Dataflow.