Sensitive Data Protection 包含許多內建 infoType 偵測工具,但您也可以建立自己的偵測工具。您可以定義自己的「自訂 infoType 偵測工具」來自訂偵測行為,讓 Sensitive Data Protection 找出符合指定模式的機密資料並予以檢查或去識別化。自訂 infoType 偵測工具的類型如下:
- 「一般自訂字典偵測工具」是 Sensitive Data Protection 用於比對的簡單字詞和詞組清單。如果字詞最多數十萬個,請使用一般自訂字典偵測工具。
- 「大型自訂字典偵測工具」是由 Sensitive Data Protection 使用儲存在 Cloud Storage 或 BigQuery 中的龐大字詞或詞組清單所產生。字詞或詞組清單龐大時 (最多高達數千萬個),宜使用大型自訂字典偵測工具。
- 「規則運算式 (regex) 偵測工具」可讓 Sensitive Data Protection 根據規則運算式模式偵測相符項目。
- 代理 infoType 偵測工具會偵測 Sensitive Data Protection 去識別化轉換
CryptoReplaceFfxFpeConfig
的輸出內容。這個自訂 infoType 偵測工具只能與content:reidentify
方法搭配用來在 FFX 模式下,使用格式保留加密 (FPE) 反向去識別化。因此,這些主題不會詳加說明替代項目。如要進一步瞭解如何及何時使用代理值自訂 infoType 偵測工具,請參閱「匿名化」一文。
此外,Sensitive Data Protection 引進「檢查規則」的概念,可讓您使用以下項目微調掃描結果:
- 「排除規則」可讓您將規則新增到內建或自訂 infoType 偵測工具中,藉此排除誤判或不需要的發現項目。
- 「啟動字詞規則」可讓您將規則新增到內建或自訂 infoType 偵測工具中,藉此提高傳回發現項目的數量或準確性。
如需進一步瞭解自訂 infoType 偵測工具,請參閱 InfoType 及 infoType 偵測工具概念網頁。如需可直接使用或視需要修改的範例,請參閱自訂 infoType 偵測工具範例。本主題的其餘部分會說明如何使用 Sensitive Data Protection 建立您自己的自訂 infoType 偵測工具。
哪裡可使用自訂 infoType 偵測工具
自訂 infoType 偵測工具會在 CustomInfoType
物件中定義。您可在 InspectConfig
物件中指定 CustomInfoType
,設定以下項目:
- 使用
projects.content.inspect
檢查。 - 在
InspectJobConfig
中的檢查工作。 - 在
InspectTemplate
中的檢查範本。 - 使用
projects.content.deidentify
的去識別化。 - 在
DeidentifyTemplate
中的去識別化範本。 - 重新識別在 FFX 模式下使用
projects.content.reidentify
搭配 FPE 去識別化的內容。這個情境僅適用於代理值自訂 infoType 偵測工具。
API 總覽
CustomInfoType
物件可讓您針對新內容建立自訂 infoType 偵測工具,或微調預先定義的 infoType 偵測工具傳回的結果。
CustomInfoType
物件由以下欄位組成,其設定如下所述:
"infotype"
:InfoType
物件所含自訂 infoType 偵測工具的名稱。"likelihood"
:這個自訂 infoType 偵測工具傳回的預設Likelihood
值。您可以在"detectionRules"
中指定替代的Likelihood
值,如果發現項目符合規則指定的條件,這個替代值將會取代底數Likelihood
。如果您沒有設定"likelihood"
欄位,自訂 infoType 偵測工具會預設為VERY_LIKELY
。如要進一步瞭解可能性,請參閱「可能性」概念頁面。"detectionRules"
:一組DetectionRule
物件,會額外套用到用這個自訂 infoType 偵測工具的所有發現項目。您可以在此指定啟動字詞規則做為HotwordRule
物件,規則會按照其指定的順序套用。這個欄位不適用於SurrogateType
物件。"sensitivityScore"
:這個自訂 infoType 偵測工具傳回的SensitivityScore
值。如果您沒有設定"sensitivityScore"
欄位,自訂 infoType 偵測工具會預設為VERY_LIKELY
。敏感度分數會用於資料剖析檔。在分析資料時,Sensitive Data Protection 會使用 infoType 的私密程度分數計算私密程度。
下列欄位其中之一 (取決於您建立的自訂 infoType 偵測工具種類):
"dictionary"
:Dictionary
物件,其中包含要搜尋的字詞或字組清單。"regex"
:Regex
物件,其中包含定義規則運算式的單一模式。"surrogateType"
:SurrogateType
物件,如有設定,則表示自訂 infoType 偵測工具為代理值。要進一步瞭解如何使用代理值自訂 infoType 偵測工具,請參閱匿名化一文。"storedType"
:現有StoredInfoType
物件的參照。建立大型自訂字典偵測工具時,必須填寫這個欄位。雖然您可以定義這個欄位來建立一般字典偵測工具或規則運算式偵測工具,但分別定義dictionary
欄位或regex
欄位會比較簡單。
後續步驟
請閱讀以下主題,進一步瞭解如何建立自訂 infoType:
- 建立一般自訂字典偵測工具:瞭解如何建立自訂 infoType 偵測工具,以比對字詞和詞組清單,找出相符的發現項目。
- 建立大型自訂字典偵測工具:瞭解如何比對非常龐大的字詞和詞組清單,以找出相符的發現項目。儲存的自訂 infoType 偵測工具可以比對高達數千萬個字詞。
- 建立自訂規則運算式偵測工具:瞭解如何建立自訂 infoType 偵測工具,以根據規則運算式找出相符的發現項目。
- 修改 infoType 偵測工具以修正掃描結果:瞭解如何針對內建和自訂 infoType 偵測工具建立可微調掃描結果的修飾詞。
- 自訂相符可能性:瞭解如何使用偵測規則和啟動字詞,來自訂指派給自訂偵測工具相符項目的可能性值。
- 自訂 infoType 偵測工具範例:多個 JSON 自訂 infoType 偵測工具定義範例,您可以視需要使用或修改。