本頁面說明如何在專案層級設定 Vertex AI 資料探索。如要剖析機構或資料夾,請參閱「剖析機構或資料夾中的 Vertex AI 資料」。
如要進一步瞭解探索服務,請參閱資料設定檔。
事前準備
確認專案已啟用 Cloud Data Loss Prevention API:
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the required API.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the required API.
確認您具備在專案層級設定資料剖析所需的 IAM 權限。
您必須在每個有資料要進行剖析的區域中,建立檢查範本。如要使用單一範本處理多個區域,可以使用儲存在
global
區域的範本。如果機構政策禁止您在global
區域建立檢查範本,則必須為每個區域設定專屬的檢查範本。詳情請參閱資料落地注意事項。這項工作僅允許在
global
區域建立檢查範本。如要為一或多個區域提供專屬檢查範本,請務必先建立這些範本,再執行這項工作。您可以設定在發生特定事件時,讓 Sensitive Data Protection 將通知傳送至 Pub/Sub,例如 Sensitive Data Protection 剖析新的資料集時。如要使用這項功能,請先建立 Pub/Sub 主題。
前往「建立掃描設定」頁面。
前往專案。在工具列上,按一下專案選取器並選取專案。
如要掃描單一資料集,請選取「掃描單一資料集」。
每個資料集只能有一個單一資源掃描設定。詳情請參閱「剖析單一資料資源」。
填寫要剖析的資料集詳細資料。
如要執行標準專案層級剖析,請選取「掃描所選專案」。
- 微調所有資料或特定資料子集的剖析頻率。
- 指定不想建立剖析資料集的資料集。
- 指定您不想多次剖析的資料集。
- 按一下「新增時間表」。
在「篩選條件」部分,定義一或多個篩選條件,指定排程範圍內的資料集。如果資料集符合至少一個已定義的篩選器,就會視為在排程範圍內。
如要設定篩選器,請指定專案 ID 或規則運算式,以指定一或多個專案。
規則運算式必須遵循 RE2 語法。
舉例來說,如要將專案中的所有資料集納入篩選條件,請在「專案 ID」欄位中輸入專案 ID。
如要新增更多篩選器,請按一下「新增篩選器」,然後重複這個步驟。
按一下「頻率」。
在「頻率」部分,指定探索服務是否應剖析您選取的資料集,以及剖析頻率:
如果不想剖析資料集,請關閉「剖析這項資料」。
如要至少剖析資料集一次,請將「剖析這項資料」保持開啟。
在這個部分的後續欄位中,您可以指定系統是否應重新分析資料,以及應觸發重新分析作業的事件。詳情請參閱「資料剖析產生頻率」。
- 如果是「On a schedule」(依排程),請指定重新分析資料集的頻率。無論資料集是否經過任何變更,系統都會重新分析。
- 如果是「檢查範本變更時」,請指定是否要在相關聯的檢查範本更新時重新剖析資料,以及重新剖析的頻率。
如果發生下列任一情況,系統就會偵測到檢查範本變更:
- 掃描設定中的檢查範本名稱有變。
- 檢查範本的
updateTime
變更。
舉例來說,如果您為
us-west1
區域設定檢查範本,並更新該範本,則只有us-west1
區域的資料會重新剖析。
選用:按一下「條件」。
在「條件」部分,您可以指定篩選器中定義的資料集必須符合哪些條件,Sensitive Data Protection 才會剖析這些資料集。
如有需要,請設定下列項目:
最低條件:如要延後剖析資料集,直到資料集達到特定時間長度,請啟用這個選項。然後輸入最短時間。
時間條件:如不希望系統剖析舊資料集,請啟用這個選項。然後使用日期挑選器選取日期和時間。 系統不會對在所選時間戳記當天或之前建立的任何資料集進行剖析。
範例條件
假設您有下列設定:
最低條件
- 最短時間:24 小時
時間條件
- 時間戳記:2022 年 5 月 4 日晚上 11:59
在本例中,Sensitive Data Protection 會排除在 2022 年 5 月 4 日晚上 11:59 前建立的任何資料集。在該日期和時間之後建立的資料集中,Sensitive Data Protection 只會剖析至少 24 小時的資料集。
按一下 [完成]。
選用:如要新增更多時間表,請按一下「新增時間表」,然後重複上述步驟。
如要指定排程的優先順序,請使用
向上鍵和 向下鍵重新排序。時間表的順序會指定如何解決時間表之間的衝突。如果資料集符合兩個不同排程的篩選器,排程清單中較高的排程會決定該資料集的剖析頻率。
選用:編輯或關閉「所有其他時間」。
清單中的最後一個時間表是適用所有情況的時間表。這項排程涵蓋所選範圍內,與您建立的任何排程都不相符的資料集。一律適用的排程會遵循系統預設的剖析頻率。
- 如要調整適用於所有情況的時段,請按一下「編輯時段」 ,然後視需要調整設定。
- 如要防止 Sensitive Data Protection 剖析適用於全面排程的任何資源,請關閉「剖析不符合任何自訂排程的資源」。
- 按一下「建立新的檢查範本」。
選用:如要修改 infoType 的預設選取項目,請按一下「管理 infoType」。
如要進一步瞭解如何管理內建和自訂的 infoType,請參閱透過Google Cloud 控制台管理 infoType。
您必須選取至少一個 infoType 才能繼續。
選用:新增規則集並設定信賴度門檻,進一步設定檢查範本。詳情請參閱「設定偵測」。
- 按一下「選取現有的檢查範本」。
- 輸入要使用的檢查範本完整資源名稱。
「Region」(區域) 欄位會自動填入儲存檢查範本的區域名稱。
輸入的檢查範本必須與要剖析的資料位於同一個區域。
為遵守資料落地規定,Sensitive Data Protection 不會使用儲存區域以外的檢查範本。
如要找出檢查範本的完整資源名稱,請按照下列步驟操作:
- 前往檢查範本清單。這個頁面會在另一個分頁中開啟。
- 切換至包含要使用檢查範本的專案。
- 在「範本」分頁中,按一下要使用的範本 ID。
- 在隨即開啟的頁面中,複製範本的完整資源名稱。完整資源名稱的格式如下:
projects/PROJECT_ID/locations/REGION/inspectTemplates/TEMPLATE_ID
- 在「建立掃描設定」頁面的「範本名稱」欄位中,貼上範本的完整資源名稱。
- 前往檢查範本清單。這個頁面會在另一個分頁中開啟。
- 如要為其他區域新增檢查範本,請按一下「新增檢查範本」,然後輸入範本的完整資源名稱。針對每個有專屬檢查範本的區域重複這個步驟。
- 選用:新增儲存在
global
區域的檢查範本。 如果區域沒有專屬的檢查範本,Sensitive Data Protection 會自動使用該範本。 開啟「將部分探索發現項目儲存至 BigQuery」。
輸入要儲存發現項目示例的 BigQuery 資料表詳細資料。
您為這項動作指定的資料表,必須與「將資料剖析檔副本儲存至 BigQuery」動作所用的資料表不同。
在「Project ID」(專案 ID) 中,輸入要匯出調查結果的現有專案 ID。
在「Dataset ID」(資料集 ID) 部分,輸入專案中現有資料集的名稱。
在「Table ID」(資料表 ID),輸入要儲存發現項目的 BigQuery 資料表名稱。如果這個資料表不存在,Sensitive Data Protection 會使用您提供的名稱,自動為您建立資料表。
開啟「發布至 Pub/Sub」。
畫面上會顯示選項清單。每個選項都說明會導致 Sensitive Data Protection 將通知傳送至 Pub/Sub 的事件。
選取應觸發 Pub/Sub 通知的事件。
如果選取「每當更新設定檔時傳送 Pub/Sub 通知」,當設定檔中的敏感度等級、資料風險等級、偵測到的 infoType、公開存取權和其他重要指標發生變化時,Sensitive Data Protection 就會傳送通知。
針對選取的每個事件,請按照下列步驟操作:
輸入主題名稱。名稱必須採用下列格式:
projects/PROJECT_ID/topics/TOPIC_ID
更改下列內容:
- PROJECT_ID:與 Pub/Sub 主題相關聯的專案 ID。
- TOPIC_ID:Pub/Sub 主題的 ID。
指定要在通知中加入完整資料集設定檔,還是只加入已設定檔資料集的完整資源名稱。
設定最低資料風險和機密程度,達到這些程度時,Sensitive Data Protection 就會傳送通知。
指定是否必須同時符合資料風險和敏感度條件,或只要符合其中一項即可。舉例來說,如果您選擇
AND
,則資料風險和敏感度條件都必須符合,Sensitive Data Protection 才會傳送通知。
- 改到「多區域」備用位置:如果圖像無法在原始位置處理,就會改到與圖像原始位置對應的多區域處理。如果圖片的原始位置沒有對應的多地區,系統就會略過該圖片。
- 改用全球位置:如果圖片無法在原始位置處理,就會改在
global
區域處理。 - 如要確保剖析功能不會在您建立掃描設定後自動啟動,請選取「在暫停模式下建立掃描作業」。
在下列情況中,這個選項會相當實用:
- 您選擇將資料剖析檔儲存至 BigQuery,並想確保服務代理程式有權寫入要儲存資料剖析檔副本的 BigQuery 資料表。
- 您選擇將部分探索發現項目儲存至 BigQuery,並希望確保服務代理程式具有 BigQuery 資料表的寫入權限,可將部分發現項目儲存至該資料表。
- 您已設定 Pub/Sub 通知,並想授予服務代理發布存取權。
- 檢查相關設定,然後點按「建立」。
Sensitive Data Protection 會建立掃描設定,並新增至探索掃描設定清單。
- 瞭解如何管理資料設定檔。
- 瞭解如何管理掃描設定。
- 瞭解如何接收及剖析資料剖析器發布的 Pub/Sub 訊息。
- 瞭解如何排解資料設定檔問題。
建立掃描設定
以下各節將詳細說明「建立掃描設定」頁面中的步驟。在每個部分結尾,按一下「繼續」。
選取探索類型
選取「Vertex AI」。
選取範圍
執行下列其中一個步驟:管理時間表
如果預設剖析頻率符合需求,可以略過「建立掃描設定」頁面的這個部分。
設定這個專區的原因如下:
如要精細調整剖析頻率,請按照下列步驟操作:
選取檢查範本
視您要提供檢查設定的方式而定,請選擇下列其中一個選項。無論選擇哪一個選項,Sensitive Data Protection 都會在資料儲存的區域掃描資料。也就是說,資料不會離開原始區域。
方法 1:建立檢查範本
如果您想在
global
區域建立新的檢查範本,請選擇這個選項。Sensitive Data Protection 建立掃描設定時,會將這個新的檢查範本儲存在
global
區域。選項 2:使用現有的檢查範本
如果您想使用現有的檢查範本,請選擇這個選項。
新增動作
本節說明如何指定您希望 Sensitive Data Protection 在剖析資料集後採取的動作。如果您想將從資料設定檔收集的洞察資料傳送至其他Google Cloud 服務,這些動作就非常實用。
發布至 Security Command Center
在 Security Command Center 中,資料剖析檔的發現項目可提供背景資訊,協助您分類安全漏洞和威脅發現項目,並制定因應計畫。
如要使用這項動作,必須先在機構層級啟用 Security Command Center。在機構層級啟用 Security Command Center 後,系統就能從 Sensitive Data Protection 等整合服務接收發現項目。Sensitive Data Protection 適用於 Security Command Center 的所有服務級別。如果未在機構層級啟用 Security Command Center,Sensitive Data Protection 發現項目就不會顯示在 Security Command Center 中。詳情請參閱「查看 Security Command Center 的啟用層級」。
如要將資料剖析結果傳送至 Security Command Center,請務必開啟「發布至 Security Command Center」選項。
詳情請參閱「將資料剖析檔發布至 Security Command Center」。
將資料設定檔副本儲存至 BigQuery
Sensitive Data Protection 會將每個產生的資料剖析檔副本儲存至 BigQuery 資料表。如果您未提供偏好資料表的詳細資料,Sensitive Data Protection 會在專案中建立資料集和資料表。根據預設,資料集名稱為
sensitive_data_protection_discovery
,資料表名稱為discovery_profiles
。這項操作可讓您保留所有產生的設定檔記錄。這項記錄有助於建立稽核報告和顯示資料設定檔。你也可以將這項資訊載入其他系統。
此外,無論資料位於哪個區域,您都能透過這個選項在單一檢視畫面中查看所有資料設定檔。雖然您也可以透過Google Cloud 控制台查看資料設定檔,但控制台一次只會顯示一個區域的設定檔。
如果 Sensitive Data Protection 無法剖析資料集,系統會定期重試。為盡量減少匯出資料中的干擾,Sensitive Data Protection 只會將成功產生的剖析檔匯出至 BigQuery。
開啟這個選項後,Sensitive Data Protection 就會開始匯出剖析檔。啟用匯出功能前產生的剖析檔不會儲存至 BigQuery。
如需分析資料設定檔時可使用的查詢範例,請參閱「分析資料設定檔」。
將部分探索發現項目儲存至 BigQuery
Sensitive Data Protection 可將範例發現項目新增至您選擇的 BigQuery 資料表。樣本結果僅代表所有結果的子集,可能無法呈現所有已發現的 infoType。一般來說,系統會為每個資料集產生約 10 個範例結果,但每次探索作業的結果數量可能不同。
每個發現項目都會包含偵測到的實際字串 (也稱為「引文」) 和確切位置。
如果您想評估檢查設定是否正確比對出您要標示為機密的資訊類型,這項動作就很有用。您可以使用匯出的資料設定檔和匯出的樣本結果執行查詢,進一步瞭解遭標記的特定項目、相符的 infoType、確切位置、計算出的敏感度等級和其他詳細資料。
如要將發現項目示例儲存至 BigQuery 資料表,請按照下列步驟操作:
如要瞭解儲存在 BigQuery 資料表中的每個發現項目內容,請參閱
DataProfileFinding
。發布至 Pub/Sub
開啟「發布至 Pub/Sub」後,您就能根據剖析結果採取程式輔助動作。您可以運用 Pub/Sub 通知,開發工作流程來擷取並修正具有重大資料風險或敏感度的發現項目。
如要將通知傳送至 Pub/Sub 主題,請按照下列步驟操作:
傳送至 Dataplex Universal Catalog 做為切面
這項動作可讓您根據資料剖析的洞察資訊,將 Dataplex Universal Catalog 切面 新增至已剖析的資料集。這項動作只會套用至新設定和更新的設定檔。 未更新的現有設定檔不會傳送至 Dataplex Universal Catalog。
啟用這項動作後,Sensitive Data Protection 會將
Sensitive Data Protection profile
切面附加至每個新建立或更新的資料集,並建立設定檔,然後將這些資料集登錄至 Dataplex Universal Catalog。產生的層面包含從資料設定檔收集的洞察資料。然後在貴機構和專案中,搜尋具有特定Sensitive Data Protection profile
方面值的項目。如要將資料剖析檔傳送至 Dataplex Universal Catalog,請務必開啟「傳送至 Dataplex Catalog 做為切面」選項。
詳情請參閱「根據資料剖析的洞察資訊新增 Dataplex Universal Catalog 切面」。
設定圖像的備用處理位置
一般來說,資訊保護服務會在資料儲存位置處理資料。不過,圖片只能在多區域或
global
區域處理。設定備用位置後,如果圖片不在多地區或global
地區,Sensitive Data Protection 就會使用備用位置處理圖片。如果略過這個部分,系統就不會處理這些圖片。如要設定圖像處理作業的備用位置,請選取下列一或兩個選項:
如果同時選取這兩個選項,Sensitive Data Protection 會選擇要使用的備用位置。
設定儲存設定的位置
按一下「資源位置」清單,然後選取要儲存這項掃描設定的區域。您稍後建立的所有掃描設定也會儲存在這個位置。
您選擇的掃描設定儲存位置不會影響要掃描的資料。系統會在資料儲存的同一區域掃描資料。詳情請參閱「資料落地注意事項」。
查看及建立
如要查看或管理掃描設定,請參閱「管理掃描設定」。
後續步驟