In dieser Kurzanleitung erfahren Sie, wie Sie dasGoogle Cloud Pipeline Components SDK (GCPC) installieren.
Neuesten Release installieren
Verwenden Sie den folgenden Befehl, um das Google Cloud SDK aus dem Python Package Index (PyPI) zu installieren:
pip install --upgrade google-cloud-pipeline-components
Vordefinierte Komponente mit dem Google Cloud SDK importieren
Nachdem Sie das Google Cloud SDK installiert haben, können Sie es zum Importieren einer vordefinierten Komponente verwenden.
Informationen zu SDK-Referenzen für unterstützte Komponenten finden Sie in der Dokumentation zumGoogle Cloud SDK.
Sie können beispielsweise den folgenden Code verwenden, um die Dataflow-Komponente in eine Pipeline zu importieren und zu verwenden.
from google_cloud_pipeline_components.v1.dataflow import DataflowPythonJobOp
from kfp import dsl
@dsl.pipeline(
name=PIPELINE_NAME,
description='Dataflow launch python pipeline'
)
def pipeline(
python_file_path:str = 'gs://ml-pipeline-playground/samples/dataflow/wc/wc.py',
project_id:str = PROJECT_ID,
location:str = LOCATION,
staging_dir:str = PIPELINE_ROOT,
requirements_file_path:str = 'gs://ml-pipeline-playground/samples/dataflow/wc/requirements.txt',
):
dataflow_python_op = DataflowPythonJobOp(
project=project_id,
location=location,
python_module_path=python_file_path,
temp_location = staging_dir,
requirements_file_path = requirements_file_path,
args = ['--output', OUTPUT_FILE],
)
Nächste Schritte
- Lesen Sie die Einführung in Pipeline-Komponenten Google Cloud .
- Prüfen Sie alle Anleitungen, die das
google_cloud_pipeline_components
SDK verwenden. - Führen Sie erste Schritte mit Dataflow-Komponenten aus.