如果您使用 Data Catalog,可以按照本文所述步驟,將 Data Catalog 內容和使用情形轉移至 Dataplex Universal Catalog。
如果您是目錄服務的新手,建議先將 Dataplex Universal Catalog 設為預設目錄服務。
本文適用對象為資料管理員和資料管理員。
Dataplex Universal Catalog 具有統一的網頁介面和 API。轉移至 Dataplex Universal Catalog 後,現有和日後的工作負載與使用者都能享有更強大的功能。詳情請參閱「關於 Dataplex Universal Catalog 中的中繼資料管理」。
如要比較 Dataplex Universal Catalog 和 Data Catalog,請參閱「Dataplex Universal Catalog 與 Data Catalog 的比較」。
開始轉移前,請先查看 Dataplex Universal Catalog 不支援的中繼資料管理功能。
轉換總覽
Google Cloud 控制台中的「Manage transition to Dataplex Universal Catalog」(管理轉移至 Dataplex Universal Catalog 的作業) 頁面,提供管理轉移作業的單一存取點。
本節將說明各種轉換情境,並概述每種情境的轉換程序。
如果您在 Data Catalog 中沒有自訂中繼資料,或從未使用過 Data Catalog
如果您使用 Data Catalog,但沒有自訂中繼資料 (例如標記、標記範本、自訂項目或項目群組),或是從未使用過 Data Catalog,請將預設目錄 UI 設為 Dataplex Universal Catalog,完成轉移程序。
如果您有 Data Catalog 自訂中繼資料或程式輔助工作負載
如果您使用 Data Catalog 搭配自訂中繼資料 (例如標記、標記範本、自訂項目或項目群組),Dataplex Universal Catalog 可以自動將這些自訂中繼資料匯入為 read-only
。如要啟用這項功能,請按照準備階段所述變更設定。
第二階段是升級階段,自訂中繼資料的有效狀態 (read-write
) 會移至 Dataplex Universal Catalog。在這個階段,您也必須更新所有程式輔助工作負載 (例如 API、用戶端程式庫、Terraform 模組和 Google Cloud CLI 指令),才能與 Dataplex Universal Catalog 互動。
以下將詳細說明轉換程序的各個階段:
準備階段:執行必要的設定工作,讓 Data Catalog 內容同時在 Dataplex Universal Catalog 中以
read-only
形式提供。在這個階段,Data Catalog 仍是中繼資料內容的授權來源。準備階段包括下列工作:
- 將 Data Catalog 私人標記範本更新為公開。
- 如果專案位於 Assured Workloads 中,請啟用標記範本和標記,以便在 Dataplex Universal Catalog 中同時提供中繼資料。
- 為自訂中繼資料設定 Dataplex Universal Catalog IAM 權限。
詳情請參閱「準備階段」。
升級階段:將目錄使用情形和自訂中繼資料的有效狀態 (
read-write
) 移至 Dataplex Universal Catalog。升級階段包含下列工作:
- 將預設目錄 UI 設為 Dataplex Universal Catalog。
將 Data Catalog 自訂中繼資料升級至 Dataplex Universal Catalog。
啟用標記範本和標記,並將標記範本設為公開後,請等待至少 48 小時,再升級自訂中繼資料。這是內部處理作業所需的時間。
更新程式輔助工作負載。
完成升級階段後,Dataplex Universal Catalog 會成為所有中繼資料的權威來源,您不需要再使用 Data Catalog。
詳情請參閱「升級階段」。
必要的角色
如要取得從 Data Catalog 轉移至 Dataplex Universal Catalog 所需的權限,請在資源上授予下列 IAM 角色:
將私人代碼範本更新為公開: Data Catalog TagTemplate 擁有者 (
roles/datacatalog.tagTemplateOwner
)這個預先定義的角色具備
datacatalog.tagTemplates.update
權限,可將私人標記範本更新為公開。啟用公開標記範本和標記,即可在 Dataplex Universal Catalog 中同時提供中繼資料: DataCatalog 遷移設定管理員 (
roles/datacatalog.migrationConfigAdmin
)這個預先定義的角色具備
datacatalog.migrationConfig.set
權限,這是啟用代碼範本和代碼的必要權限。將預設目錄 UI 設為 Dataplex Universal Catalog: DataCatalog 遷移設定管理員 (
roles/datacatalog.migrationConfigAdmin
)這個預先定義的角色包含
datacatalog.migrationConfig.set
權限,這是設定預設目錄 UI 體驗的必要權限。將 Data Catalog 公開標記範本升級至 Dataplex Universal Catalog: Data Catalog TagTemplate Owner (
roles/datacatalog.tagTemplateOwner
)這個預先定義的角色具備
datacatalog.tagTemplates.update
權限,這是升級公開標記範本的必要權限。將 Data Catalog 項目群組升級至 Dataplex Universal Catalog: DataCatalog EntryGroup 擁有者 (
roles/datacatalog.entryGroupOwner
)這個預先定義的角色具備
datacatalog.entryGroups.update
權限,這是升級項目群組的必要權限。
如要進一步瞭解如何授予角色,請參閱「管理專案、資料夾和機構的存取權」一文。
準備階段
這個階段的任務包括讓 Data Catalog 中繼資料內容同時在 Dataplex Universal Catalog 中以 read-only
模式提供。
準備階段的重點如下:
- Data Catalog 仍是自訂中繼資料的授權來源。
- Dataplex Universal Catalog 的「搜尋」頁面預設會指向 Data Catalog 搜尋,其中只包含 Data Catalog 中繼資料,不含 Dataplex Universal Catalog 中繼資料。
- 完成準備階段前,Dataplex Universal Catalog 搜尋功能可能不會將所有 Data Catalog 公開標記範本和標記納入搜尋範圍。
進一步瞭解如何同時在 Dataplex Universal Catalog 中使用 Data Catalog 中繼資料
Data Catalog 自訂項目群組及其項目已同步至 Dataplex Universal Catalog,並顯示為 read-only
。在準備階段啟用公開標記範本和標記後,這些內容會同時轉換至 Dataplex Universal Catalog,並成為 read-only
。
下表顯示 Data Catalog 資源同步至 Dataplex Universal Catalog 時,兩者之間的對應關係:
Data Catalog 資源 | 對應的 Dataplex Universal Catalog 資源 | 說明 |
---|---|---|
標記範本 | 切面類型 (全球) | Data Catalog 中的標記範本是區域性資源。 啟用標記範本後,標記範本的內容會同時在 Dataplex Universal Catalog 中顯示為全域切面類型。這是為了保留標記和標記範本之間的跨區域參照。屆時全域切面類型的定義將複製到所有 Google Cloud 區域。 系統切面類型會代表標準概念 (例如 |
標記 | 選用切面 | 啟用標記範本後,標記會立即在 Dataplex Universal Catalog 中顯示為選用切面。詳情請參閱各類別的層面。 |
項目群組 | 項目群組 | 系統項目的項目群組會在 Dataplex Universal Catalog 中,依專案和區域建立。在 Data Catalog 中建立的項目群組會立即同步至 Dataplex Universal Catalog。 |
自訂項目 | 自訂項目 | Data Catalog 中的所有自訂項目會同時轉換為 Dataplex Universal Catalog 中的 GenericEntryType 項目。詳情請參閱「項目類型類別」。 |
系統項目 (Google Cloud) | 系統必須輸入的面向 | 系統項目的中繼資料 (例如 BigQuery 資料表的 Schema ) 會擷取至系統定義切面類型的必要切面。 |
將 Data Catalog 私人標記範本更新為公開
Dataplex Universal Catalog 不支援私人切面 (對應於私人標記) 的概念。因此私人標記範本和標記不會立即同步至 Dataplex Universal Catalog。如要在 Dataplex Universal Catalog 中傳播私人標記範本和標記,您必須將這些資源設為公開。
繼續操作前,請先檢查私人標記範本的結構,確認結構和中繼資料與公開標記的瀏覽權限一致。
如要將私人標記範本和標記設為公開,請按照下列步驟操作:
控制台
在 Google Cloud 控制台,前往 Dataplex Universal Catalog 的「Catalog」(目錄) 頁面。
按一下「管理轉移至 Dataplex Universal Catalog 的作業」。
按一下「私有標記範本」分頁標籤。
按一下「管理代碼範本」。
在「代碼範本」頁面中,按一下要更新的私人代碼範本。
在「範本詳細資料」頁面中,按一下「編輯」。
在「顯示設定」部分選取「公開」。
按一下「Update」。
REST
如要將私人標記範本更新為公開,請使用 tagTemplates.patch
方法。
啟用公開標記範本和標記,即可在 Dataplex Universal Catalog 中同時提供中繼資料
啟用後,Data Catalog 公開標記範本和標記的內容會持續自動傳播至 Google Cloud 機構或專案中的 Dataplex Universal Catalog。Data Catalog 公開標記範本和標記會傳播至 Dataplex Universal Catalog,分別成為公開切面類型和切面。屆時全域切面類型的定義將複製到所有 Google Cloud 區域。
如要啟用公開標記範本和標記,請按照下列步驟操作:
控制台
在 Google Cloud 控制台,前往 Dataplex Universal Catalog 的「Catalog」(目錄) 頁面。
按一下「管理轉移至 Dataplex Universal Catalog 的作業」。
按一下「啟用」分頁標籤。
按一下「選擇啟用」。
在確認對話方塊中輸入顯示的文字,然後按一下「確認」。
REST
如要啟用標記範本和標記,請使用 setConfig
方法。
無論是 Google Cloud 機構還是專案,您都可以按一下「撤銷選擇加入」,撤銷原先提供的選擇加入。取消啟用後,系統會停止將 Data Catalog 標記範本和標記傳播至 Dataplex Universal Catalog。透過啟用程序建立的 Dataplex Universal Catalog 切面類型和切面,如果尚未升級至 Dataplex Universal Catalog,都會遭到刪除。刪除程序最多可能需要 12 小時。
為自訂中繼資料設定 Dataplex Universal Catalog IAM 權限
如果 Dataplex Universal Catalog 切面類型和自訂項目群組代表 Data Catalog 中的標記範本和項目群組,就不會繼承原先的 Data Catalog IAM 權限,Dataplex Universal Catalog 和 Data Catalog 所需的特定 IAM 權限也不同。
舉例來說,如要使用傳播的切面類型 (代表 Data Catalog 標記範本) 建立切面,您必須為該切面類型設定必要的 IAM 權限。同樣地,當您擷取自訂中繼資料時,如要在傳播的自訂項目群組中建立自訂項目,必須為該項目群組設定必要的 IAM 權限。
如果您使用 Data Catalog IAM 角色,在專案層級或更高層級管理 Data Catalog 的存取權,系統會自動納入必要的 Dataplex Universal Catalog 權限。不過,如果您使用自訂角色,或直接將 IAM 角色指派給特定資源,則必須手動為這些特定切面和自訂項目群組設定 Dataplex Universal Catalog 權限。
如要進一步瞭解 Data Catalog 的 IAM 權限如何對應至 Dataplex Universal Catalog 的權限,請參閱「Data Catalog 和 Dataplex Universal Catalog 之間的 IAM 權限對應」。
如要為切面類型和自訂項目群組設定必要的 Dataplex Universal Catalog IAM 權限,請按照下列步驟操作:
控制台
在 Google Cloud 控制台,前往 Dataplex Universal Catalog 的「Catalog」(目錄) 頁面。
按一下「管理轉移至 Dataplex Universal Catalog 的作業」。
按一下「Dataplex IAM 權限」分頁標籤。
如要為切面類型設定 Dataplex Universal Catalog IAM 權限,請點選「切面類型和標記範本」。
如果是從資料目錄傳播的代碼範本,請依序點選 >「權限」。
按一下「新增主體」。
新增主體,並指派必要角色。
按一下 [儲存]。
如要為項目群組設定 Dataplex Universal Catalog IAM 權限,請點選「項目群組」。
如果是從資料目錄傳播的項目群組,請依序點選 >「權限」。
按一下「新增主體」。
新增主體,並指派必要角色。
按一下 [儲存]。
REST
如要為切面類型設定 Dataplex Universal Catalog IAM 權限,請使用 aspectTypes.setIamPolicy
方法。
如要為項目群組設定 Dataplex Universal Catalog IAM 權限,請使用 entryGroups.setIamPolicy
方法。
升級階段
這個階段的任務是將 Data Catalog 自訂中繼資料的有效狀態 (read-write
) 移至 Dataplex Universal Catalog。
升級期間請注意下列要點:
- Dataplex Universal Catalog 的「Search」(搜尋) 頁面預設會指向 Dataplex Universal Catalog 搜尋功能。
- 您可以在 Dataplex Universal Catalog 中探索及讀取 Data Catalog 和 Dataplex Universal Catalog 中繼資料。
- 如要在 Google Cloud 控制台中更新中繼資料,系統會將你重新導向至來源。舉例來說,如果您要更新 Data Catalog 標記範本,系統會將您重新導向至 Data Catalog 的標記範本頁面。
將預設目錄 UI 設為 Dataplex Universal Catalog
將預設目錄 UI 設為 Dataplex Universal Catalog 後,會發生下列情況:
在Google Cloud 控制台中前往 Dataplex Universal Catalog 的「Search」(搜尋) 頁面時,系統預設會顯示 Dataplex Universal Catalog (Dataplex Catalog) 搜尋結果。Dataplex Universal Catalog 搜尋範圍涵蓋 Dataplex Universal Catalog,可找出所有中繼資料內容,包括在 Dataplex Universal Catalog 建立的內容,以及從 Data Catalog 匯入的內容。
Data Catalog 搜尋功能只會尋找 Data Catalog 內容,不會尋找 Dataplex Universal Catalog 內容。因此,建議您使用 Dataplex Universal Catalog 搜尋功能。
網頁介面會建議您在 Dataplex Universal Catalog 中建立新資源。舉例來說,預設會顯示「建立切面類型」,而不是「建立標記範本」,以及「建立項目群組 (Dataplex Universal Catalog)」,而不是「建立項目群組 (Data Catalog)」。
將預設目錄 UI 設為 Dataplex Universal Catalog 通常是單向作業。不過,在例外情況下,Dataplex Universal Catalog 可讓您還原變更,例如想將預設目錄 UI 體驗切換回 Data Catalog 時。如果還原變更,您將無法透過 Data Catalog 網頁介面存取在 Dataplex Universal Catalog 建立的任何內容。
如要將預設目錄 UI 設為 Dataplex Universal Catalog,請按照下列步驟操作:
控制台
在 Google Cloud 控制台,前往 Dataplex Universal Catalog 的「Catalog」(目錄) 頁面。
按一下「管理轉移至 Dataplex Universal Catalog 的作業」。
按一下「預設目錄 UI 體驗」分頁標籤。
按一下「將預設目錄 UI 設為 Dataplex Universal Catalog」。
REST
如要將預設目錄 UI 設為 Dataplex Universal Catalog,請使用 setConfig
方法。
將 Data Catalog 自訂中繼資料升級至 Dataplex Universal Catalog
您可以將已啟用的 Data Catalog 公開標記範本和自訂項目群組升級至 Dataplex Universal Catalog。請務必分別升級每個標記範本和自訂項目群組。
以下是升級程序的摘要說明:
效果
- 將資源的有效狀態從 Data Catalog 移轉至 Dataplex Universal Catalog。升級後,如要修改資源或查看資源目前狀態,就必須透過 Dataplex Universal Catalog 執行。
資料內容和流程異動
- 在 Data Catalog 中將資源標示為
read-only
。 - 在 Dataplex Universal Catalog 中,將資源標示為
read-write
。 - 停止同時提供這項資源。
- 在 Data Catalog 中將資源標示為
依附元件
- 升級標記範本時,使用該範本的所有標記也會一併升級。
- 如果升級項目群組,當中所有項目也會升級。
- 升級項目後,並不會影響其標記和對應標記範本的升級狀態。
升級前,如要修改項目的業務背景 (例如 overview
、contacts
),可以使用 Data Catalog API 和 Dataplex API。升級後,您只能使用 Dataplex API。
下文說明可對已加上標記的自訂 Data Catalog 項目執行的作業,視相關自訂項目群組和標記範本的升級狀態而定:
- 如果標記範本在 Data Catalog 中處於啟用狀態,您可以使用該範本建立標記。將標記範本升級至 Dataplex Universal Catalog 後,您就無法在 Data Catalog 中使用該範本建立標記。
- 您必須先升級標記範本,才能使用從 Data Catalog 標記範本傳播的切面類型建立切面。
如要將 Data Catalog 標記範本和自訂項目群組升級至 Dataplex Universal Catalog,請按照下列步驟操作:
控制台
請確認啟用功能和公開標記範本後,至少經過 48 小時,再將 Data Catalog 標記範本升級至 Dataplex Universal Catalog。這是內部處理作業的必要時間。
在 Google Cloud 控制台,前往 Dataplex Universal Catalog 的「Catalog」(目錄) 頁面。
按一下「管理轉移至 Dataplex Universal Catalog 的作業」。
按一下「升級至 Dataplex」分頁標籤。
如要將 Data Catalog 標記範本升級至 Dataplex Universal Catalog,請按一下「查看切面類型和標記範本」。
選取要升級的代碼範本。
按一下「升級」。
在確認對話方塊中,按一下「確認」。
如要將 Data Catalog 自訂項目群組升級至 Dataplex Universal Catalog,請按一下「查看項目群組」。
選取要升級的項目群組。
按一下「升級」。
在確認對話方塊中,按一下「確認」。
REST
請務必在啟用功能並公開標記範本後,等待至少 48 小時,再將 Data Catalog 標記範本升級至 Dataplex Universal Catalog。這是內部處理作業的必要時間。
接著,如要將 Data Catalog 標記範本和自訂項目群組升級至 Dataplex Universal Catalog,請使用 tagTemplates.patch
方法。
完成升級階段後,Dataplex Universal Catalog 會成為所有中繼資料的權威來源,您不需要再使用 Data Catalog。
更新程式輔助工作負載
Dataplex Universal Catalog 隨附新版 API、用戶端程式庫、Terraform 模組和 Google Cloud CLI 指令。因此,您必須將所有以程式輔助方式使用 Data Catalog 的現有工作負載,更新為 Dataplex Universal Catalog。請參閱 Dataplex Universal Catalog 的程式碼範例。
請務必一併更新程式輔助工作負載和相關資源,例如標記範本和自訂項目群組。這是必要步驟,因為升級會將資源的有效 (read-write
) 狀態從 Data Catalog 移至 Dataplex Universal Catalog。
以下範例序列說明如何更新程式輔助工作負載,與 Dataplex Universal Catalog 互動,並協調升級相依資源:
如果工作負載可容許最終一致性,請將工作負載的
read
作業移至 Dataplex Universal Catalog。將執行標記
write
作業的工作負載移至 Dataplex Universal Catalog,並協調升級對應的標記範本。將執行自訂擷取
write
作業的工作負載移至 Dataplex Universal Catalog,並協調升級相關自訂項目群組。
如要將更新工作負載和升級對應資源分開處理,請考慮在工作負載中導入邏輯,根據資源升級狀態將要求路徑導向 Data Catalog 或 Dataplex Universal Catalog。read-write
因此,工作負載的運作方式與相關資源的升級狀態無關。
後續步驟
- 進一步瞭解 Dataplex Universal Catalog 的中繼資料管理功能。
- 瞭解如何在 Dataplex Universal Catalog 中搜尋資源。
- 瞭解如何管理層面及豐富中繼資料。
- 瞭解如何管理項目及擷取自訂來源。
- 請參閱 Dataplex API 參考資料。