機密データの保護により、テキスト コンテンツ内のセンシティブ データを検出して分類できます。テキストを渡すと、DLP API がテキスト内で検出した infoType、可能性の値、オフセット情報を返します
おすすめの方法
スキャンを特定して優先順位を付ける
リソースを特定し、どのリソースに対するスキャンの優先度を最も高くするかを指定することが重要です。開始直後は、分類が必要なデータのバックログが大量にあるため、すべてをすぐにスキャンすることはできません。アクセス頻度の高いデータ、大勢がアクセスできるデータ、不明なデータなど、リスクが最も高いデータを最初に選択します。
レイテンシを短縮する
レイテンシは、スキャンするデータの量、スキャン対象のストレージ リポジトリ、有効にする infoType の数と種類など、複数の要因の影響を受けます。
ジョブのレイテンシを短縮するため、次の方法を試すことができます。
- サンプリングを有効にする。
- 不要な infoType は有効にしないでください。
PERSON_NAME
、FEMALE_NAME
、MALE_NAME
、FIRST_NAME
、LAST_NAME
、DATE_OF_BIRTH
、LOCATION
、STREET_ADDRESS
、ORGANIZATION_NAME
などの一部の infoType が含まれていると特定のシナリオでは役に立つこともありますが、リクエストの処理に大幅に時間がかかる可能性があります。 - infoType は常に明示的に指定します。空の infoType リストを使用しないでください。
- 可能であれば、検査するデータを行と列があるテーブルに整理して、ネットワーク ラウンドトリップを減らすことを検討してください。
最初のスキャンの範囲を制限する
最良の結果を得るには、最初のスキャンで全データをスキャンするのではなく、範囲を制限します。数個のリクエストから始めてください。有効にする検出器と除外ルールを微調整して誤検出を減らすと、検出結果がより有意なものなります。誤検出や役に立たない検出結果により、リスクの評価が難しくなる可能性があるため、その必要がないときにすべての infoType をオンにすることは避けてください。DATE
、TIME
、DOMAIN_NAME
、URL
などの infoType では検出結果が広範囲になるため、特定のシナリオを除いて、逆効果になる可能性があります。
オンプレミス、ハイブリッド、マルチクラウドのスキャン
スキャン対象のデータがオンプレミスまたは Google Cloud の外部にある場合は、API メソッド content.inspect
と content.deidentify
を使用してコンテンツをスキャンすると、検出結果を分類して、コンテンツをローカル ストレージの外部に保持することなく仮名化します。
テキスト文字列の検査
以下では、DLP API でテキスト文字列内の機密データを検査する JSON サンプルと言語のコードを示します。
C#
機密データの保護用のクライアント ライブラリをインストールして使用する方法については、機密データの保護のクライアント ライブラリをご覧ください。
機密データの保護のために認証するには、アプリケーションのデフォルト認証情報を設定します。 詳細については、ローカル開発環境の認証の設定をご覧ください。
Go
機密データの保護用のクライアント ライブラリをインストールして使用する方法については、機密データの保護のクライアント ライブラリをご覧ください。
機密データの保護のために認証するには、アプリケーションのデフォルト認証情報を設定します。 詳細については、ローカル開発環境の認証の設定をご覧ください。
Java
機密データの保護用のクライアント ライブラリをインストールして使用する方法については、機密データの保護のクライアント ライブラリをご覧ください。
機密データの保護のために認証するには、アプリケーションのデフォルト認証情報を設定します。 詳細については、ローカル開発環境の認証の設定をご覧ください。
Node.js
機密データの保護用のクライアント ライブラリをインストールして使用する方法については、機密データの保護のクライアント ライブラリをご覧ください。
機密データの保護のために認証するには、アプリケーションのデフォルト認証情報を設定します。 詳細については、ローカル開発環境の認証の設定をご覧ください。
PHP
機密データの保護用のクライアント ライブラリをインストールして使用する方法については、機密データの保護のクライアント ライブラリをご覧ください。
機密データの保護のために認証するには、アプリケーションのデフォルト認証情報を設定します。 詳細については、ローカル開発環境の認証の設定をご覧ください。
Python
機密データの保護用のクライアント ライブラリをインストールして使用する方法については、機密データの保護のクライアント ライブラリをご覧ください。
機密データの保護のために認証するには、アプリケーションのデフォルト認証情報を設定します。 詳細については、ローカル開発環境の認証の設定をご覧ください。
Ruby
機密データの保護用のクライアント ライブラリをインストールして使用する方法については、機密データの保護のクライアント ライブラリをご覧ください。
機密データの保護のために認証するには、アプリケーションのデフォルト認証情報を設定します。 詳細については、ローカル開発環境の認証の設定をご覧ください。
REST
JSON で DLP API を使用する方法については、JSON クイックスタートをご覧ください。
JSON 入力:
POST https://dlp.googleapis.com/v2/projects/[PROJECT_ID]/content:inspect?key={YOUR_API_KEY}
{
"item":{
"value":"My phone number is (415) 555-0890"
},
"inspectConfig":{
"includeQuote":true,
"minLikelihood":"POSSIBLE",
"infoTypes":{
"name":"PHONE_NUMBER"
}
}
}
JSON 出力:
{
"result":{
"findings":[
{
"quote":"(415) 555-0890",
"infoType":{
"name":"PHONE_NUMBER"
},
"likelihood":"VERY_LIKELY",
"location":{
"byteRange":{
"start":"19",
"end":"33"
},
"codepointRange":{
"start":"19",
"end":"33"
}
},
"createTime":"2018-11-13T19:29:15.412Z"
}
]
}
}
テキスト ファイルの検査
以下に、テキスト ファイル内の機密データを検査するサンプルコードを示します。
C#
機密データの保護用のクライアント ライブラリをインストールして使用する方法については、機密データの保護のクライアント ライブラリをご覧ください。
機密データの保護のために認証するには、アプリケーションのデフォルト認証情報を設定します。 詳細については、ローカル開発環境の認証の設定をご覧ください。
Go
機密データの保護用のクライアント ライブラリをインストールして使用する方法については、機密データの保護のクライアント ライブラリをご覧ください。
機密データの保護のために認証するには、アプリケーションのデフォルト認証情報を設定します。 詳細については、ローカル開発環境の認証の設定をご覧ください。
Java
機密データの保護用のクライアント ライブラリをインストールして使用する方法については、機密データの保護のクライアント ライブラリをご覧ください。
機密データの保護のために認証するには、アプリケーションのデフォルト認証情報を設定します。 詳細については、ローカル開発環境の認証の設定をご覧ください。
Node.js
機密データの保護用のクライアント ライブラリをインストールして使用する方法については、機密データの保護のクライアント ライブラリをご覧ください。
機密データの保護のために認証するには、アプリケーションのデフォルト認証情報を設定します。 詳細については、ローカル開発環境の認証の設定をご覧ください。
Python
機密データの保護用のクライアント ライブラリをインストールして使用する方法については、機密データの保護のクライアント ライブラリをご覧ください。
機密データの保護のために認証するには、アプリケーションのデフォルト認証情報を設定します。 詳細については、ローカル開発環境の認証の設定をご覧ください。
Ruby
機密データの保護用のクライアント ライブラリをインストールして使用する方法については、機密データの保護のクライアント ライブラリをご覧ください。
機密データの保護のために認証するには、アプリケーションのデフォルト認証情報を設定します。 詳細については、ローカル開発環境の認証の設定をご覧ください。
次のステップ
- 機密データの保護による機密データの削除の Codelab に取り組む。
- 画像の機密データを検査する方法を学習する。