Sensitive Data Protection verfügt über viele leistungsstarke Funktionen. Allerdings können die Kosten, je nachdem, wie viele Informationen Sensitive Data Protection scannen soll, aus dem Ruder laufen. In diesem Thema werden verschiedene Methoden beschrieben, mit denen Sie die Kosten niedrig halten und gleichzeitig dafür sorgen können, dass mit Sensitive Data Protection nur die gewünschten Daten gescannt werden.
Prüfung
Google empfiehlt die folgenden Vorgehensweisen, um die Inspektionskosten zu senken.
Mit Stichproben die Anzahl der überprüften Byte einschränken
Im Fall von BigQuery-Tabellen oder Cloud Storage-Buckets kann der Schutz sensibler Daten einen kleinen Teil der Datenmenge scannen. Dies kann eine Stichprobe von Scanergebnissen liefern, ohne die potenziellen Kosten für das Scannen eines gesamten Datasets zu verursachen.
Wenn Sie vertrauliche Daten gefunden haben, können Sie einen zweiten, gründlicheren Scan dieses Datasets planen, um die gesamte Liste der Ergebnisse zu ermitteln.
Weitere Informationen finden Sie unter Menge des zu prüfenden Inhalts begrenzen in Speicher und Datenbanken auf sensible Daten untersuchen.
Nur geänderte Daten scannen
Sie können Sensitive Data Protection anweisen, Daten, die seit der letzten Überprüfung nicht geändert wurden, nicht zu scannen. Mit dem Festlegen einer Zeitspanne können Sie anhand des Zeitpunkts der letzten Änderung steuern, welche Daten gescannt werden sollen.
Wenn Sie Jobtrigger verwenden, können Sie in TimespanConfig
das Flag enable_auto_population_of_timespan_config
festlegen, um Inhalte zu überspringen, die beim letzten geplanten Job gescannt wurden.
Weitere Informationen finden Sie unter Scans ausschließlich auf neuen Inhalt beschränken in Sensitive Data Protection-Inspektionsjobs erstellen und planen.
Dateiscans in Cloud Storage auf ausschließlich relevante Dateien beschränken
Durch Angabe von CloudStorageRegexFileSet
können Sie über reguläre Ausdrucksfilter genauer steuern, welche Dateien oder Ordner in Buckets einbezogen oder ausgeschlossen werden sollen.
Dies ist dann nützlich, wenn Sie das Scannen von Dateien überspringen möchten, von denen Sie wissen, dass sie keine vertraulichen Daten enthalten, z. B. Sicherungen, TMP-Dateien, statische Webinhalte usw.
Discovery
Wir empfehlen die folgenden Maßnahmen, um die Kosten für die Datenprofilerstellung zu senken.
Schätzung ausführen
Bevor Sie mit dem Erstellen von Datenprofilen beginnen, sollten Sie zuerst eine Schätzung durchführen. Wenn Sie eine Schätzung ausführen, können Sie die Größe und Form der zu profilierenden BigQuery-Daten nachvollziehen. Jede Schätzung enthält die ungefähre Anzahl der Tabellen, die Datengröße und die Profiling-Kosten. Außerdem wird eine Prognose für das monatliche Wachstum Ihrer BigQuery-Daten angezeigt.
Weitere Informationen zum Ausführen einer Schätzung finden Sie hier:
- Kosten für die Datenprofilerstellung für eine Organisation oder einen Ordner schätzen
- Kosten für die Datenprofilerstellung für ein einzelnes Projekt schätzen
Zeitpläne in Ihren Scankonfigurationen hinzufügen
Um die Kosten für die Datenprofilerstellung zu senken, können Sie einen Zeitplan erstellen, in dem Sie Filter und Bedingungen festlegen. Hier einige Beispiele:
- Wenn Sie bestimmte Tabellen nicht profilieren müssen, können Sie angeben, dass Tabellen, die Ihren Filtern entsprechen, niemals profiliert werden dürfen.
- Wenn Sie nur bestimmte Tabellen profilieren möchten, können Sie die Profilerstellung für alle Tabellen deaktivieren, mit Ausnahme der Tabellen, die Ihrem Filter entsprechen.
- Wenn Sie möchten, dass für bestimmte Tabellen nur einmal ein Profil erstellt wird, können Sie angeben, dass für diese Tabellen nie wieder ein Profil erstellt werden soll.
- Wenn Sie keine Profile für alte Tabellen erstellen müssen, können Sie eine Bedingung festlegen, damit nur Tabellen profiliert werden, die nach einem bestimmten Datum erstellt wurden.
- Wenn Sie keine Profile für neue Tabellen erstellen müssen, können Sie eine Bedingung festlegen, damit Profile nur für Tabellen erstellt werden, die ein bestimmtes Alter oder eine Mindestanzahl von Zeilen erreichen.
Kosten in einem Dashboard einsehen und Audit-Logs abfragen
Erstellen Sie ein Dashboard, um Ihre Abrechnungsdaten anzeigen und Ihre Nutzung des Schutzes sensibler Daten anpassen zu können. Darüber hinaus können Sie Ihre Audit-Logs in Sensitive Data Protection streamen, um die Nutzungsmuster zu analysieren.
Sie können Ihre Abrechnungsdaten nach BigQuery exportieren und sie in einem Tool wie Looker Studio visualisieren. Eine Anleitung zum Erstellen eines Abrechnungsdashboards finden Sie unter Google Cloud -Abrechnung mit BigQuery und Looker Studio visualisieren.
Außerdem haben Sie die Möglichkeit, Ihre Audit-Logs in BigQuery zu streamen und sie auf Muster wie die Abfragekosten nach Nutzer zu analysieren.
Budgetbenachrichtigungen festlegen
Wenn Sie einen Budgetalarm festlegen, können Sie verfolgen, wie Ihre Ausgaben sich einem festgelegten Betrag nähern. Durch das Festlegen eines Budgets wird die API-Nutzung nicht begrenzt. Sie werden nur benachrichtigt, wenn der Ausgabebetrag den angegebenen Betrag erreicht.