Google Cloud パイプライン コンポーネント(GCPC)SDK には、本番環境の品質、パフォーマンス、使いやすさを備えた一連のビルド済み Kubeflow パイプライン コンポーネントが備わっています。Google Cloud パイプライン コンポーネントを使用して、Kubeflow Pipelines に準拠する Vertex AI Pipelines やその他の ML パイプライン実行バックエンドで ML パイプラインを定義して実行できます。
たとえば、コンポーネントを使用して、以下の処理を行うことができます。
- 新しいデータセットを作成し、さまざまな種類のデータ(画像、表形式、テキスト、動画)を読み込む。
- データセットから Cloud Storage にデータをエクスポートする。
- AutoML で、画像、表形式、テキスト、動画のデータを使用してモデルをトレーニングする。
- カスタム コンテナまたは Python パッケージを使用して、カスタム トレーニング ジョブを実行する。
- 既存のモデルを Vertex AI にアップロードしてバッチ予測をアップロードする。
- 新しいエンドポイントを作成し、オンライン予測に使用するモデルをデプロイする。
また、ビルド済みの Google Cloud Pipeline コンポーネントは Vertex AI Pipelines でサポートされており、次のような利点があります。
- デバッグが容易: コンポーネントから起動された基盤となるリソースを確認できるので、デバッグを容易に行うことができます。
- 標準化されたアーティファクト タイプ: 入出力に標準のアーティファクト タイプを使用する一貫したインターフェースが提供されます。これらの標準アーティファクトは Vertex ML Metadata で追跡されるため、パイプラインのアーティファクトのリネージを簡単に分析できます。アーティファクトのリネージの詳細については、パイプライン アーティファクトのリネージの追跡をご覧ください。
- 請求ラベルによるパイプライン費用について理解する: リソースラベルは、パイプライン実行の Google Cloud パイプライン コンポーネントによって生成された Google Cloud サービスに自動的に伝達されます。BigQuery に Cloud Billing をエクスポートするときに合わせて課金ラベルを使用すると、パイプライン実行の費用を確認できます。ラベルを使用してパイプライン実行のコストを理解するには、パイプライン実行コストについて理解するをご覧ください。パイプラインの実行から Google Cloud パイプライン コンポーネントによって生成されたリソースにラベルが伝播される方法の詳細については、Vertex AI Pipelines によるリソースのラベル付けをご覧ください。
- 費用対効果*: Vertex AI Pipelines は、コンテナを起動せずに Google Cloud リソースを起動することで、これらのコンポーネントの実行を最適化します。これにより、起動時のレイテンシが短縮され、ビジー待機中のコンテナの費用を抑えることができます。
* | この機能は、次のコンポーネントにのみ適用されます。
|
次のステップ
google_cloud_pipeline_components
SDK を使用するすべてのチュートリアルを確認する。- リファレンス セクションで特定の Google Cloud パイプライン コンポーネントの詳細を確認する。
- 公式の
google_cloud_pipeline_components
SDK リファレンスを読む。 - Kubeflow Pipelines SDK リポジトリで Google Cloud Pipeline コンポーネントのセクションを確認する。