本文件概述了可用來將中繼資料從第三方來源匯入 Dataplex 通用目錄的受管理連線管道。
您可以透過受管理的連線功能,大規模地將中繼資料匯入 Dataplex 通用目錄。受管理的連結管道會從資料來源擷取中繼資料,然後將中繼資料匯入 Dataplex 通用目錄。管道也會視需要在Google Cloud 專案中建立 Dataplex Universal Catalog 項目群組。您可以調度工作流程,並根據需求排定匯入工作。
您可以自行建立自訂連接器,從第三方來源擷取中繼資料。舉例來說,您可以建立連接器,從 MySQL、SQL Server、Oracle、Snowflake、Databricks 等來源擷取中繼資料。如要瞭解建構自訂連接器範例的步驟,請參閱「開發用於匯入中繼資料的自訂連接器」。您也可以使用社群貢獻的自訂連接器,適用於各種第三方來源。
如要瞭解如何執行受管理的連線管道,請參閱「使用工作流程從自訂來源匯入中繼資料」一文。
受管理連線服務的運作方式
下圖顯示管理式連線管道。
大致來說,受管理的連線服務的運作方式如下:
-
連接器必須是可在 Dataproc Serverless 上執行的 Artifact Registry 映像檔。
您可以在工作流程 (自動化調度管理平台) 中執行受管理的連線管道。
受管理的連線管道會執行下列操作:
- 如果項目群組尚不存在,則會根據您的設定建立目標項目群組。
- 執行連接器。連接器會從資料來源擷取中繼資料,並產生可匯入 Dataplex 通用目錄的中繼資料匯入檔案。
- 監控中繼資料擷取的進度。
- 執行中繼資料匯入工作,將中繼資料匯入 Dataplex Universal Catalog。
- 監控中繼資料匯入工作的進度。
這個受管理的連線管道會使用 Dataproc Serverless 執行連接器,並使用 Dataplex 通用目錄中繼資料匯入 API 方法執行中繼資料匯入工作。
您匯入的中繼資料包含 Dataplex Universal Catalog 項目及其切面。如要進一步瞭解 Dataplex Universal Catalog 中繼資料,請參閱「關於 Dataplex Universal Catalog 中的資料目錄管理」。
社群提供的自訂連接器
如要從第三方來源匯入中繼資料,您可以使用社群提供的自訂連接器。請參閱各個連接器的 README 檔案,瞭解設定說明和連接器的更多資訊。
資料來源 | 存放區 |
---|---|
MySQL | mysql-connector |
Oracle | oracle-connector |
PostgreSQL | postgresql-connector |
Snowflake | snowflake-connector |
SQL Server | sql-server-connector |