指標參考資料

本頁面列出並說明資料設定檔中收集的所有指標。

資料設定檔有三種:專案資料設定檔資料表資料設定檔資料欄資料設定檔

專案資料設定檔

每個專案資料設定檔都有下列欄位。這些欄位的值是根據專案中分析的資源匯總而來。

深入分析

專案資料剖析檔可提供下列洞察資訊:

資料風險
資料在目前狀態下的風險程度。詳情請參閱「機密程度與資料風險等級」。
機密等級
分數:指出這個專案的機密程度。詳情請參閱「機密程度與資料風險等級」。

中繼資料

專案資料剖析檔會提供下列中繼資料:

上次產生設定檔的時間
上次產生設定檔的日期和時間。
專案 ID
已分析的專案 ID。
資源名稱
資料設定檔的完整名稱。
狀態
:表示剖析作業狀態的圖示。

資料表資料剖析檔

每個資料表資料設定檔都包含下列欄位:

深入分析

資料表資料剖析檔可提供下列洞察資訊:

資料風險
資料在目前狀態下的風險程度。詳情請參閱「機密程度與資料風險等級」。
機密等級
表示這個資料表機密程度的分數。詳情請參閱「機密程度與資料風險等級」。

中繼資料

資料表資料剖析檔提供下列中繼資料:

資料庫
內含已剖析資料表的資料庫。這個欄位僅適用於 Cloud SQL 探索
資料集 ID
包含此資料表的資料集 ID。
加密
這個資料表的加密作業是由 Google 還是貴機構管理。
到期時間
選用。這個資料表的到期時間。
失敗的資料欄數量
因發生錯誤而略過的資料表中資料欄數。
檢查設定快照
設定檔產生時使用的檢查範本快照。詳情請參閱「資料剖析快照」。
執行個體
包含已剖析資料表的執行個體。這個欄位僅適用於 Cloud SQL 探索
上次產生設定檔的時間
上次產生設定檔的日期和時間。
在 BigQuery 中的上次更新時間
這個資料表上次修改的日期和時間。
專案 ID
包含這個表格的專案 ID。
公開

這個資料表是否開放所有使用者存取,或僅限特定使用者。

資源標籤

設定檔產生時資料表擁有的標籤

資源標記

資料表在產生設定檔時的標記

資源名稱

資料設定檔的完整名稱。

資料列數

設定檔產生時,這個資料表中的資料列數。

已掃描的資料欄數量

這個資料表中已剖析的資料欄數。

服務帳戶

具有存取這個資料表 IAM 權限的服務帳戶數量。

狀態

指出設定檔是否成功生成。

資料表 ID

這個表格的 ID。

資料表建立時間

資料表的建立日期和時間。

資料表大小

設定檔產生時這個資料表的大小。

類型

執行的探索類型

資料欄資料剖析

每個資料欄資料剖析都有下列欄位:

深入分析

資料欄資料剖析提供下列洞察資訊:

資料風險
資料在目前狀態下的風險程度。詳情請參閱「機密程度與資料風險等級」。
機密等級
分數:指出此資料欄的機密程度。詳情請參閱「機密程度與資料風險等級」。
預測的 infoType

如果單一內建自訂 infoType 明顯多於資料欄中的其他類型,Sensitive Data Protection 就會將這個欄位設為該 infoType。否則這個欄位沒有值。

如要查看系統在資料欄中偵測到的所有 infoType 清單,請參閱「其他 infoType」欄位。

Sensitive Data Protection 只會掃描您在檢查範本中指定的 infoType。因此,只有這些 infoType 會顯示在「預測的 infoType」欄位。舉例來說,如果資料欄含有電子郵件地址,但您未在檢查範本中加入 EMAIL_ADDRESS infoType 偵測工具,則這個欄位不會包含 EMAIL_ADDRESS

如果資料欄資料主要符合屬於同一一般類別的數個密切相關 infoType,機密資料防護功能會將這個欄位設為較一般的 infoType。舉例來說,如果資料欄主要包含 PASSPORTAUSTRALIA_PASSPORTCANADA_PASSPORT infoType,系統就會將「預測的 infoType」欄位設為 PASSPORT。「其他 infoType」欄位會顯示更具體的 infoType,以及預估使用率。

其他 infoType

系統在資料欄中偵測到的 infoType,但信號不夠強,無法視為該資料欄的預測 infoType。請參閱本文的「預測的 infoType」一節。

如果是 2022 年 10 月 13 日後產生的資料剖析檔,這個欄位列出的每個 infoType 都會有「預估普及率」。預估使用率是指系統偵測到 infoType 的非空值資料列所占的約略百分比。

舉例來說,假設您有一個資料欄包含下列指標:

  • 預測的 infoType: FDA_CODE
  • 其他 infoType: PERSON_NAME (2%)STREET_ADDRESS (1%)

在本例中,有強烈跡象顯示該資料欄包含 FDA 代碼。「機密資料保護」服務也判斷出,該資料欄中約有 2% 的非空值列可能含有人員姓名,1% 可能含有街道地址。

Sensitive Data Protection 只會掃描您在檢查範本中指定的 infoType。因此,只有這些 infoType 會顯示在「其他 infoType」欄位。舉例來說,如果資料欄包含電子郵件地址,但您未在檢查範本中加入 EMAIL_ADDRESS infoType 偵測工具,則這個欄位不會包含 EMAIL_ADDRESS

預估空值占比

這個資料欄中空值的約略比例,分為高、中、低或極低。如果這個資料欄中大部分的項目都是空值,這個值就會很高。

預估不重複性

這是預估此欄中包含了多少不重複的資料,並分為高、中或低。唯一性高代表此欄中包含了不重複的值。如果唯一值比例很高,可能表示該資料欄含有 ID。

唯一性低則代表這個欄中包含了許多常見的值,例如列舉或布林值。

如果「敏感性資料保護」判斷表格中的資料列不足,無法計算這項指標,這個值就會空白。

自由文字分數

這個資料欄包含任意形式文字的機率。如果值接近 1,表示該欄可能包含任意形式或自然語言的文字。可能的值介於 0 到 1 之間。

如果自由文字分數偏高,資料欄的資料風險和敏感度等級可能會提高。

中繼資料

資料欄資料剖析檔會提供下列中繼資料:

資料庫
內含已剖析資料表資料欄的資料庫。這個欄位僅適用於 Cloud SQL 探索
資料類型
這個資料欄內容的資料類型。
資料集 ID
包含這個資料表欄的資料集 ID。
欄位 ID
資料欄名稱。
執行個體
包含已剖析資料表資料欄的執行個體。這個欄位僅適用於 Cloud SQL 探索
執行個體位置
包含已剖析資料表欄的執行個體位置。這個欄位僅適用於 Cloud SQL 探索。
上次產生設定檔的時間
上次產生設定檔的日期和時間。
政策標記
指出資料欄是否套用政策標記。如要瞭解使用政策標記的最佳做法,請參閱「在 BigQuery 中使用政策標記」一文。
專案 ID
包含這個資料表欄的專案 ID。
資源名稱
資料設定檔的完整名稱。
狀態
表示剖析作業狀態的圖示。
資料表 ID
包含這個資料欄的資料表 ID。

檔案儲存庫資料剖析檔

Sensitive Data Protection 使用「檔案存放區」一詞,代表檔案儲存 bucket 或容器。

每個檔案儲存庫資料剖析檔都包含下列欄位。

深入分析

檔案儲存庫資料剖析檔可提供下列洞察資訊:

資料風險
資料在目前狀態下的風險程度。詳情請參閱「機密程度與資料風險等級」。
檔案叢集
提供剖析這個檔案儲存區時偵測到的每個檔案叢集摘要。如要進一步瞭解各項摘要,請參閱本頁面的「檔案集合摘要」一節。
機密等級
分數:指出這個檔案儲存空間的機密程度。 詳情請參閱「機密程度與資料風險等級」。

中繼資料

檔案儲存庫資料剖析檔會提供下列中繼資料:

資料儲存位置

如果您分析的是雙區域 Cloud Storage bucket,這個欄位會列出兩個區域。

如果您從其他雲端服務供應商分析檔案儲存空間,這個值就是雲端服務供應商儲存檔案儲存空間的區域。

加密

這個檔案儲存空間的加密作業是由 Google 還是貴機構管理。

檔案儲存庫類型

剖析資料的來源,例如 Cloud Storage、Amazon S3 或 Azure Blob 儲存體。

檔案儲存庫路徑

檔案商店的名稱。

檢查設定快照

設定檔產生時所用檢查範本的快照。詳情請參閱「資料剖析快照」。

位置類型

檔案儲存位置類型:regiondual-regionmulti-region

最初建立剖析檔的時間

首次建立設定檔的日期和時間。

上次產生設定檔的時間

上次產生設定檔的日期和時間。

父項 ID

擁有剖析資料的資源。

  • 如果資料設定檔適用於 Google Cloud 資源,則這是包含資料的專案 ID。
  • 如果資料剖析檔適用於 Amazon S3 儲存空間,則這是包含該儲存空間的 AWS 帳戶 ID。
  • 如果資料剖析檔適用於 Azure Blob 儲存體容器,則這是包含該容器的 Azure 訂閱項目 ID。
公開

這個檔案儲存庫是否開放所有使用者存取,或僅限特定使用者存取。

資源標籤

設定檔產生時檔案儲存庫的標籤。

資源標記

設定檔產生時檔案儲存庫的標記

資源地區

包含檔案儲存空間的區域或多區域。

如果您分析雙區域 Cloud Storage 值區,這個值取決於值區是否儲存在預先定義的雙區域:

  • 如果是預先定義的雙重區域,Sensitive Data Protection 會將這個值設為預先定義的雙重區域名稱。
  • 如果是標準雙區域,Sensitive Data Protection 會將這個值設為包含雙區域的多區域。如要瞭解如何將單一地區對應至多地區,請參閱雙區域
資源名稱

資料設定檔的完整名稱。

狀態

指出設定檔是否成功生成。

檔案集合摘要

產生檔案儲存庫資料剖析檔時,檔案會分組為檔案叢集。Sensitive Data Protection 會為每個檔案叢集提供摘要。

每個檔案叢集摘要都包含下列欄位:

資料風險
這個檔案叢集中資料的相關風險程度。詳情請參閱「機密程度與資料風險等級」。
錯誤
生成檔案儲存資料設定檔時偵測到的任何錯誤。
掃描的副檔名
系統偵測並掃描的檔案類型清單,用於產生檔案儲存庫資料剖析檔。
發現的副檔名
系統偵測到的檔案類型清單,但不一定經過掃描。
InfoType
這個檔案叢集中偵測到的內建自訂 infoType 清單。
機密等級
分數:指出這個檔案叢集的機密程度。 詳情請參閱「機密程度與資料風險等級」。
類型
表示這個叢集中的檔案類別。如要進一步瞭解所有支援的檔案集合,請參閱「檔案集合」。