自訂 infoType 偵測工具

Sensitive Data Protection 包含許多內建 infoType 偵測工具,但您也可以建立自己的偵測工具。您可以定義自己的「自訂 infoType 偵測工具」來自訂偵測行為,讓 Sensitive Data Protection 找出符合指定模式的機密資料並予以檢查或去識別化。自訂 infoType 偵測工具的類型如下:

  • 「一般自訂字典偵測工具」是 Sensitive Data Protection 用於比對的簡單字詞和詞組清單。如果字詞最多數十萬個,請使用一般自訂字典偵測工具。
  • 「大型自訂字典偵測工具」是由 Sensitive Data Protection 使用儲存在 Cloud Storage 或 BigQuery 中的龐大字詞或詞組清單所產生。字詞或詞組清單龐大時 (最多高達數千萬個),宜使用大型自訂字典偵測工具。
  • 「規則運算式 (regex) 偵測工具」可讓 Sensitive Data Protection 根據規則運算式模式偵測相符項目。
  • 代理 infoType 偵測工具會偵測 Sensitive Data Protection 去識別化轉換 CryptoReplaceFfxFpeConfig 的輸出內容。這個自訂 infoType 偵測工具只能與 content:reidentify 方法搭配用來在 FFX 模式下,使用格式保留加密 (FPE) 反向去識別化。因此,這些主題不會詳加說明替代項目。如要進一步瞭解如何及何時使用代理值自訂 infoType 偵測工具,請參閱「匿名化」一文。

此外,Sensitive Data Protection 引進「檢查規則」的概念,可讓您使用以下項目微調掃描結果:

  • 「排除規則」可讓您將規則新增到內建或自訂 infoType 偵測工具中,藉此排除誤判或不需要的發現項目。
  • 「啟動字詞規則」可讓您將規則新增到內建或自訂 infoType 偵測工具中,藉此提高傳回發現項目的數量或準確性。

如需進一步瞭解自訂 infoType 偵測工具,請參閱 InfoType 及 infoType 偵測工具概念網頁。如需可直接使用或視需要修改的範例,請參閱自訂 infoType 偵測工具範例。本主題的其餘部分會說明如何使用 Sensitive Data Protection 建立您自己的自訂 infoType 偵測工具。

哪裡可使用自訂 infoType 偵測工具

自訂 infoType 偵測工具會在 CustomInfoType 物件中定義。您可在 InspectConfig 物件中指定 CustomInfoType,設定以下項目:

API 總覽

CustomInfoType 物件可讓您針對新內容建立自訂 infoType 偵測工具,或微調預先定義的 infoType 偵測工具傳回的結果。

CustomInfoType 物件由以下欄位組成,其設定如下所述:

  • "infotype"InfoType 物件所含自訂 infoType 偵測工具的名稱。
  • "likelihood":這個自訂 infoType 偵測工具傳回的預設 Likelihood 值。您可以在 "detectionRules" 中指定替代的 Likelihood 值,如果發現項目符合規則指定的條件,這個替代值將會取代底數 Likelihood。如果您沒有設定 "likelihood" 欄位,自訂 infoType 偵測工具會預設為 VERY_LIKELY。如要進一步瞭解可能性,請參閱「可能性」概念頁面。
  • "detectionRules":一組 DetectionRule 物件,會額外套用到用這個自訂 infoType 偵測工具的所有發現項目。您可以在此指定啟動字詞規則做為 HotwordRule 物件,規則會按照其指定的順序套用。這個欄位不適用於 SurrogateType 物件。
  • "sensitivityScore":這個自訂 infoType 偵測工具傳回的 SensitivityScore 值。如果您沒有設定 "sensitivityScore" 欄位,自訂 infoType 偵測工具會預設為 VERY_LIKELY

    敏感度分數會用於資料剖析檔。在分析資料時,Sensitive Data Protection 會使用 infoType 的私密程度分數計算私密程度

  • 下列欄位其中之一 (取決於您建立的自訂 infoType 偵測工具種類):

    • "dictionary"Dictionary 物件,其中包含要搜尋的字詞或字組清單。
    • "regex"Regex 物件,其中包含定義規則運算式的單一模式。
    • "surrogateType"SurrogateType 物件,如有設定,則表示自訂 infoType 偵測工具為代理值。要進一步瞭解如何使用代理值自訂 infoType 偵測工具,請參閱匿名化一文。
    • "storedType":現有 StoredInfoType 物件的參照。建立大型自訂字典偵測工具時,必須填寫這個欄位。雖然您可以定義這個欄位來建立一般字典偵測工具或規則運算式偵測工具,但分別定義 dictionary 欄位或 regex 欄位會比較簡單。

後續步驟

請閱讀以下主題,進一步瞭解如何建立自訂 infoType: