本頁面列出並說明資料設定檔中收集的所有指標。
資料設定檔有三種:專案資料設定檔、資料表資料設定檔和資料欄資料設定檔。
專案資料設定檔
每個專案資料設定檔都有下列欄位。這些欄位的值是根據專案中分析的資源匯總而來。
深入分析
專案資料剖析檔可提供下列洞察資訊:
- 資料風險
- 資料在目前狀態下的風險程度。詳情請參閱「機密程度與資料風險等級」。
- 機密等級
- 分數:指出這個專案的機密程度。詳情請參閱「機密程度與資料風險等級」。
中繼資料
專案資料剖析檔會提供下列中繼資料:
- 上次產生設定檔的時間
- 上次產生設定檔的日期和時間。
- 專案 ID
- 已分析的專案 ID。
- 資源名稱
- 資料設定檔的完整名稱。
- 狀態
- :表示剖析作業狀態的圖示。
資料表資料剖析檔
每個資料表資料設定檔都包含下列欄位:
深入分析
資料表資料剖析檔可提供下列洞察資訊:
- 資料風險
- 資料在目前狀態下的風險程度。詳情請參閱「機密程度與資料風險等級」。
- 機密等級
- 表示這個資料表機密程度的分數。詳情請參閱「機密程度與資料風險等級」。
中繼資料
資料表資料剖析檔提供下列中繼資料:
- 資料庫
- 內含已剖析資料表的資料庫。這個欄位僅適用於 Cloud SQL 探索。
- 資料集 ID
- 包含此資料表的資料集 ID。
- 加密
- 這個資料表的加密作業是由 Google 還是貴機構管理。
- 到期時間
- 選用。這個資料表的到期時間。
- 失敗的資料欄數量
- 因發生錯誤而略過的資料表中資料欄數。
- 檢查設定快照
- 設定檔產生時使用的檢查範本快照。詳情請參閱「資料剖析快照」。
- 執行個體
- 包含已剖析資料表的執行個體。這個欄位僅適用於 Cloud SQL 探索。
- 上次產生設定檔的時間
- 上次產生設定檔的日期和時間。
- 在 BigQuery 中的上次更新時間
- 這個資料表上次修改的日期和時間。
- 專案 ID
- 包含這個表格的專案 ID。
- 公開
這個資料表是否開放所有使用者存取,或僅限特定使用者。
- 資源標籤
設定檔產生時資料表擁有的標籤。
- 資源標記
資料表在產生設定檔時的標記。
- 資源名稱
資料設定檔的完整名稱。
- 資料列數
設定檔產生時,這個資料表中的資料列數。
- 已掃描的資料欄數量
這個資料表中已剖析的資料欄數。
- 服務帳戶
具有存取這個資料表 IAM 權限的服務帳戶數量。
- 狀態
指出設定檔是否成功生成。
- 資料表 ID
這個表格的 ID。
- 資料表建立時間
資料表的建立日期和時間。
- 資料表大小
設定檔產生時這個資料表的大小。
- 類型
執行的探索類型。
資料欄資料剖析
每個資料欄資料剖析都有下列欄位:
深入分析
資料欄資料剖析提供下列洞察資訊:
- 資料風險
- 資料在目前狀態下的風險程度。詳情請參閱「機密程度與資料風險等級」。
- 機密等級
- 分數:指出此資料欄的機密程度。詳情請參閱「機密程度與資料風險等級」。
- 預測的 infoType
如果單一內建或自訂 infoType 明顯多於資料欄中的其他類型,Sensitive Data Protection 就會將這個欄位設為該 infoType。否則這個欄位沒有值。
如要查看系統在資料欄中偵測到的所有 infoType 清單,請參閱「其他 infoType」欄位。
Sensitive Data Protection 只會掃描您在檢查範本中指定的 infoType。因此,只有這些 infoType 會顯示在「預測的 infoType」欄位。舉例來說,如果資料欄含有電子郵件地址,但您未在檢查範本中加入
EMAIL_ADDRESS
infoType 偵測工具,則這個欄位不會包含EMAIL_ADDRESS
。如果資料欄資料主要符合屬於同一一般類別的數個密切相關 infoType,機密資料防護功能會將這個欄位設為較一般的 infoType。舉例來說,如果資料欄主要包含
PASSPORT
、AUSTRALIA_PASSPORT
和CANADA_PASSPORT
infoType,系統就會將「預測的 infoType」欄位設為PASSPORT
。「其他 infoType」欄位會顯示更具體的 infoType,以及預估使用率。- 其他 infoType
系統在資料欄中偵測到的 infoType,但信號不夠強,無法視為該資料欄的預測 infoType。請參閱本文的「預測的 infoType」一節。
如果是 2022 年 10 月 13 日後產生的資料剖析檔,這個欄位列出的每個 infoType 都會有「預估普及率」。預估使用率是指系統偵測到 infoType 的非空值資料列所占的約略百分比。
舉例來說,假設您有一個資料欄包含下列指標:
- 預測的 infoType:
FDA_CODE
- 其他 infoType:
PERSON_NAME (2%)
、STREET_ADDRESS (1%)
在本例中,有強烈跡象顯示該資料欄包含 FDA 代碼。「機密資料保護」服務也判斷出,該資料欄中約有 2% 的非空值列可能含有人員姓名,1% 可能含有街道地址。
Sensitive Data Protection 只會掃描您在檢查範本中指定的 infoType。因此,只有這些 infoType 會顯示在「其他 infoType」欄位。舉例來說,如果資料欄包含電子郵件地址,但您未在檢查範本中加入
EMAIL_ADDRESS
infoType 偵測工具,則這個欄位不會包含EMAIL_ADDRESS
。- 預測的 infoType:
- 預估空值占比
這個資料欄中空值的約略比例,分為高、中、低或極低。如果這個資料欄中大部分的項目都是空值,這個值就會很高。
- 預估不重複性
這是預估此欄中包含了多少不重複的資料,並分為高、中或低。唯一性高代表此欄中包含了不重複的值。如果唯一值比例很高,可能表示該資料欄含有 ID。
唯一性低則代表這個欄中包含了許多常見的值,例如列舉或布林值。
如果「敏感性資料保護」判斷表格中的資料列不足,無法計算這項指標,這個值就會空白。
- 自由文字分數
這個資料欄包含任意形式文字的機率。如果值接近 1,表示該欄可能包含任意形式或自然語言的文字。可能的值介於 0 到 1 之間。
如果自由文字分數偏高,資料欄的資料風險和敏感度等級可能會提高。
中繼資料
資料欄資料剖析檔會提供下列中繼資料:
- 資料庫
- 內含已剖析資料表資料欄的資料庫。這個欄位僅適用於 Cloud SQL 探索。
- 資料類型
- 這個資料欄內容的資料類型。
- 資料集 ID
- 包含這個資料表欄的資料集 ID。
- 欄位 ID
- 資料欄名稱。
- 執行個體
- 包含已剖析資料表資料欄的執行個體。這個欄位僅適用於 Cloud SQL 探索。
- 執行個體位置
- 包含已剖析資料表欄的執行個體位置。這個欄位僅適用於 Cloud SQL 探索。
- 上次產生設定檔的時間
- 上次產生設定檔的日期和時間。
- 政策標記
- 指出資料欄是否套用政策標記。如要瞭解使用政策標記的最佳做法,請參閱「在 BigQuery 中使用政策標記」一文。
- 專案 ID
- 包含這個資料表欄的專案 ID。
- 資源名稱
- 資料設定檔的完整名稱。
- 狀態
- 表示剖析作業狀態的圖示。
- 資料表 ID
- 包含這個資料欄的資料表 ID。
檔案儲存庫資料剖析檔
Sensitive Data Protection 使用「檔案存放區」一詞,代表檔案儲存 bucket 或容器。
每個檔案儲存庫資料剖析檔都包含下列欄位。
深入分析
檔案儲存庫資料剖析檔可提供下列洞察資訊:
- 資料風險
- 資料在目前狀態下的風險程度。詳情請參閱「機密程度與資料風險等級」。
- 檔案叢集
- 提供剖析這個檔案儲存區時偵測到的每個檔案叢集摘要。如要進一步瞭解各項摘要,請參閱本頁面的「檔案集合摘要」一節。
- 機密等級
- 分數:指出這個檔案儲存空間的機密程度。 詳情請參閱「機密程度與資料風險等級」。
中繼資料
檔案儲存庫資料剖析檔會提供下列中繼資料:
- 資料儲存位置
如果您分析的是雙區域 Cloud Storage bucket,這個欄位會列出兩個區域。
如果您從其他雲端服務供應商分析檔案儲存空間,這個值就是雲端服務供應商儲存檔案儲存空間的區域。
- 加密
這個檔案儲存空間的加密作業是由 Google 還是貴機構管理。
- 檔案儲存庫類型
剖析資料的來源,例如 Cloud Storage、Amazon S3 或 Azure Blob 儲存體。
- 檔案儲存庫路徑
檔案商店的名稱。
- 檢查設定快照
- 位置類型
檔案儲存位置類型:
region
、dual-region
或multi-region
。- 最初建立剖析檔的時間
首次建立設定檔的日期和時間。
- 上次產生設定檔的時間
上次產生設定檔的日期和時間。
- 父項 ID
擁有剖析資料的資源。
- 如果資料設定檔適用於 Google Cloud 資源,則這是包含資料的專案 ID。
- 如果資料剖析檔適用於 Amazon S3 儲存空間,則這是包含該儲存空間的 AWS 帳戶 ID。
- 如果資料剖析檔適用於 Azure Blob 儲存體容器,則這是包含該容器的 Azure 訂閱項目 ID。
- 公開
這個檔案儲存庫是否開放所有使用者存取,或僅限特定使用者存取。
- 資源標籤
設定檔產生時檔案儲存庫的標籤。
- 資源標記
設定檔產生時檔案儲存庫的標記。
- 資源地區
包含檔案儲存空間的區域或多區域。
如果您分析雙區域 Cloud Storage 值區,這個值取決於值區是否儲存在預先定義的雙區域:
- 資源名稱
資料設定檔的完整名稱。
- 狀態
指出設定檔是否成功生成。
檔案集合摘要
產生檔案儲存庫資料剖析檔時,檔案會分組為檔案叢集。Sensitive Data Protection 會為每個檔案叢集提供摘要。
每個檔案叢集摘要都包含下列欄位:
- 資料風險
- 這個檔案叢集中資料的相關風險程度。詳情請參閱「機密程度與資料風險等級」。
- 錯誤
- 生成檔案儲存資料設定檔時偵測到的任何錯誤。
- 掃描的副檔名
- 系統偵測並掃描的檔案類型清單,用於產生檔案儲存庫資料剖析檔。
- 發現的副檔名
- 系統偵測到的檔案類型清單,但不一定經過掃描。
- InfoType
- 這個檔案叢集中偵測到的內建和自訂 infoType 清單。
- 機密等級
- 分數:指出這個檔案叢集的機密程度。 詳情請參閱「機密程度與資料風險等級」。
- 類型
- 表示這個叢集中的檔案類別。如要進一步瞭解所有支援的檔案集合,請參閱「檔案集合」。