Auf dieser Seite wird beschrieben, wie Sie Storage Insights-Datasets und Dataset-Konfigurationen erstellen und verwalten. Weitere Informationen zu Storage Insights-Datasets
Hinweise
Bevor Sie mit dem Erstellen und Verwalten von Datasets und Dataset-Konfigurationen beginnen, folgen Sie der Anleitung in den folgenden Unterabschnitten.
Erforderliche Rollen abrufen
Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für Ihre Quellprojekte zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Erstellen und Verwalten von Datasets benötigen:
-
So erstellen, verwalten und sehen Sie sich Dataset-Konfigurationen an:
Storage Insights Admin (
roles/storageinsights.admin
) -
So rufen Sie Datasets auf, verknüpfen sie und heben die Verknüpfung auf:
-
Storage Insights-Analyst (
roles/storageinsights.analyst
) -
BigQuery-Administrator (
roles/bigquery.admin
)
-
Storage Insights-Analyst (
-
So löschen Sie verknüpfte Datasets:
BigQuery-Administrator (
roles/bigquery.admin
) -
So rufen Sie Datasets in BigQuery auf und fragen sie ab:
-
Betrachter von Storage Insights (
roles/storageinsights.viewer
) -
BigQuery-Jobnutzer (
roles/bigquery.jobUser
) -
BigQuery Data Viewer (
roles/bigquery.dataViewer
)
-
Betrachter von Storage Insights (
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Diese vordefinierten Rollen enthalten die Berechtigungen, die zum Erstellen und Verwalten von Datasets erforderlich sind. Erweitern Sie den Abschnitt Erforderliche Berechtigungen, um die erforderlichen Berechtigungen anzuzeigen:
Erforderliche Berechtigungen
Die folgenden Berechtigungen sind erforderlich, um Datasets zu erstellen und zu verwalten:
-
Dataset-Konfiguration erstellen:
storageinsights.datasetConfigs.create
-
Dataset-Konfiguration ansehen:
-
storageinsights.datasetConfigs.get
-
storageinsights.datasetConfigs.list
-
-
Dataset-Konfiguration verwalten:
-
storageinsights.datasetConfigs.update
-
storageinsights.datasetConfigs.delete
-
-
Link zum BigQuery-Dataset:
storageinsights.datasetConfigs.linkDataset
-
Verknüpfung zum BigQuery-Dataset aufheben:
storageinsights.datasetConfigs.unlinkDataset
-
Mit BigQuery verknüpfte Datasets abfragen:
bigquery.jobs.create or bigquery.jobs.*
Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
Storage Insights API aktivieren
Console
Befehlszeile
Führen Sie den folgenden Befehl aus, um die Storage Insights API in Ihrem aktuellen Projekt zu aktivieren:
gcloud services enable storageinsights.googleapis.com
Weitere Informationen zum Aktivieren von Diensten für ein Google Cloud -Projekt finden Sie unter Dienste aktivieren und deaktivieren.
Storage Intelligence konfigurieren
Storage Intelligence muss für das Projekt, den Ordner oder die Organisation konfiguriert sein, die Sie mit Datasets analysieren möchten.
Dataset-Konfiguration erstellen
So erstellen Sie eine Dataset-Konfiguration und generieren ein Dataset: Weitere Informationen zu den Feldern, die Sie beim Erstellen der Dataset-Konfiguration angeben können, finden Sie unter Attribute der Dataset-Konfiguration.
Console
- Wechseln Sie in der Google Cloud Console zur Seite Storage Insights von Cloud Storage.
Klicken Sie auf Dataset konfigurieren.
Geben Sie im Abschnitt Dataset benennen einen Namen für Ihr Dataset ein. Geben Sie optional eine Beschreibung für den Datensatz ein.
Gehen Sie im Abschnitt Dataset-Bereich definieren so vor:
Wählen Sie eine der folgenden Optionen aus:
Wenn Sie Speichermetadaten für alle Projekte in der aktuellen Organisation abrufen möchten, wählen Sie Organisation einschließen aus.
Wenn Sie Speichermetadaten für alle Projekte in den ausgewählten Ordnern abrufen möchten, wählen Sie Ordner einschließen(Unterorganisation/Abteilungen) aus. Informationen zum Abrufen von Ordner-IDs finden Sie unter Ordner und Projekte ansehen oder auflisten. So fügst du Ordner hinzu:
- Geben Sie im Feld Ordner 1 die Ordner-ID ein.
- Optional: Wenn Sie mehrere Ordner-IDs hinzufügen möchten, klicken Sie auf + Weiteren Ordner hinzufügen.
Wenn Sie Speichermetadaten für die ausgewählten Projekte abrufen möchten, wählen Sie Projekte durch Angabe von Projektnummern einbeziehen aus. Informationen zum Ermitteln der Projektnummern finden Sie unter Projektname, -nummer und -ID finden. So fügen Sie Projekte hinzu:
- Geben Sie im Feld Projekt 1 die Projektnummer ein.
- Optional: Wenn Sie mehrere Projektnummern hinzufügen möchten, klicken Sie auf + Weiteres Projekt hinzufügen.
Wenn Sie Projekte oder Ordner im Bulk-Verfahren hinzufügen möchten, wählen Sie Liste mit Projekten /Ordnern über CSV-Datei hochladen aus. Die CSV-Datei muss die Projektnummern oder Ordner-IDs enthalten, die Sie in das Dataset aufnehmen möchten.
Geben Sie an, ob zukünftige Buckets automatisch in die ausgewählte Ressource aufgenommen werden sollen.
Wenn Sie optional Filter für Buckets basierend auf Regionen und Bucket-Präfixen angeben möchten, maximieren Sie den Bereich Filter (optional). Filter werden additiv auf Buckets angewendet.
Sie können Buckets aus bestimmten Regionen ein- oder ausschließen. Sie können beispielsweise Buckets in den Regionen
me-central1
undme-central2
ausschließen. Sie können Buckets auch nach Präfix ein- oder ausschließen. Wenn Sie beispielsweise Buckets ausschließen möchten, die mitmy-bucket
beginnen, geben Sie das Präfixmy-bucket*
ein.
Klicken Sie auf Weiter.
Wählen Sie im Abschnitt Aufbewahrungsdauer auswählen eine Aufbewahrungsdauer für die Daten im Dataset aus.
Wählen Sie im Abschnitt Ort zum Speichern des konfigurierten Datasets auswählen einen Ort zum Speichern des Datasets und der Datasetkonfiguration aus.
Wählen Sie im Abschnitt Dienstkontotyp auswählen einen Dienstagententyp für Ihren Datensatz aus. Dieser Dienst-Agent wird in Ihrem Namen erstellt, wenn Sie die Dataset-Konfiguration erstellen. Sie können einen der folgenden Kundenservicemitarbeiter auswählen:
- Konfigurationsbezogenes Dienstkonto: Dieser Dienst-Agent kann nur auf das Dataset zugreifen und in das Dataset schreiben, das von der jeweiligen Dataset-Konfiguration generiert wird.
- Dienstkonto mit Projektbereich: Dieser Dienst-Agent kann auf Datasets zugreifen und sie schreiben, die aus allen Dataset-Konfigurationen im Projekt generiert werden.
Nach der Erstellung des Dienst-Agents müssen Sie ihm die erforderlichen Berechtigungen gewähren. Weitere Informationen zu diesen Dienst-Agents finden Sie unter Konfigurationsattribute für Datasets.
Klicken Sie auf Konfigurieren. Nachdem Sie das Dataset konfiguriert haben, kann es bis zu 48 Stunden dauern, bis die ersten Daten im verknüpften Dataset angezeigt werden.
Befehlszeile
Führen Sie den Befehl
gcloud storage insights dataset-configs create
mit den erforderlichen Flags aus, um eine Dataset-Konfiguration zu erstellen:gcloud storage insights dataset-configs create DATASET_CONFG_ID \ --source-projects=SOURCE_PROJECT_NUMBERS \ --location=LOCATION \ --retention-period-days=RETENTION_PERIOD_DAYS \ --organization=ORGANIZATION_ID
Ersetzen Sie:
DATASET_CONFIG_ID
durch den Namen, den Sie der Datasetkonfiguration geben möchten. Namen werden als Kennung von Dataset-Konfigurationen verwendet und können geändert werden. Der Name kann bis zu 128 Zeichen mit Buchstaben, Ziffern und Unterstrichen enthalten.SOURCE_PROJECT_NUMBERS
mit den Nummern der Projekte, die Sie in das Dataset aufnehmen möchten. Beispiel:464036093014
Sie können ein oder mehrere Projekte angeben. Informationen zum Ermitteln der Projektnummer finden Sie unter Projektname, ‑nummer und ‑ID ermitteln.Alternativ zum Flag
--source-projects
können Sie das Flag--source-projects-file=FILE_PATH
verwenden. Damit können Sie mehrere Projektnummern gleichzeitig angeben, indem Sie eine Datei mit den Projektnummern hochladen. Die Datei muss im CSV-Format vorliegen und in Cloud Storage hochgeladen werden.Ersetzen Sie
LOCATION
durch den Speicherort, an dem die Dataset-Konfiguration und das Dataset gespeichert werden.Ersetzen Sie
RETENTION_PERIOD_DAYS
durch den Aufbewahrungszeitraum für die Daten im Dataset.Ersetzen Sie
ORGANIZATION_ID
durch die Ressourcen-ID der Organisation, zu der die Quellprojekte gehören. Quellprojekte außerhalb des angegebenen Standorts werden aus der Dataset-Konfiguration ausgeschlossen. Informationen zum Abrufen Ihrer Organisations-ID finden Sie unter Organisations-Ressourcen-ID abrufen.
Optional können Sie zusätzliche Flags verwenden, um das Dataset genauer zu konfigurieren:
Verwenden Sie
--include-buckets=BUCKET_NAMES_OR_REGEX
, um bestimmte Buckets nach Name oder regulärem Ausdruck einzuschließen. Wenn dieses Flag verwendet wird, kann--exclude-buckets
nicht verwendet werden.Verwenden Sie
--exclude-buckets=BUCKET_NAMES_OR_REGEX
, um bestimmte Buckets nach Name oder regulärem Ausdruck auszuschließen. Wenn dieses Flag verwendet wird, kann--include-buckets
nicht verwendet werden.Mit
--project=DESTINATION_PROJECT_ID
können Sie ein Projekt angeben, in dem die Dataset-Konfiguration und das generierte Dataset gespeichert werden sollen. Wenn dieses Flag nicht verwendet wird, ist das Zielprojekt Ihr aktives Projekt. Weitere Informationen zu Projekt-IDs finden Sie unter Projekte erstellen und verwalten.Mit
--auto-add-new-buckets
werden alle Buckets, die in Zukunft Quellprojekten hinzugefügt werden, automatisch einbezogen.Verwenden Sie
--skip-verification
, um Prüfungen und Fehler aus dem Bestätigungsprozess zu überspringen. Dazu gehören auch Prüfungen für erforderliche IAM-Berechtigungen. Wenn sie verwendet werden, werden einige oder alle Buckets möglicherweise aus dem Dataset ausgeschlossen.Mit
--identity=IDENTITY_TYPE
wird der Typ des Dienst-Agents angegeben, der zusammen mit der Dataset-Konfiguration erstellt wird. Mögliche Werte sindIDENTITY_TYPE_PER_CONFIG
undIDENTITY_TYPE_PER_PROJECT
. Wenn nicht angegeben, lautet die StandardeinstellungIDENTITY_TYPE_PER_CONFIG
.Verwenden Sie
--description=DESCRIPTION
, um eine Beschreibung für die Dataset-Konfiguration zu erstellen.
REST APIs
JSON API
Die gcloud CLI installieren und initialisieren, um ein Zugriffstoken für den Header
Authorization
zu generieren.Erstellen Sie eine JSON-Datei, die folgende Informationen enthält:
{ "organizationNumber": "ORGANIZATION_ID", "sourceProjects": { "project_numbers": ["PROJECT_NUMBERS", ...] }, "retentionPeriodDays": "RETENTION_PERIOD_DAYS", "identity": { "type": "IDENTITY_TYPE" } }
Ersetzen Sie:
ORGANIZATION_ID
mit der Ressourcen-ID der Organisation ersetzen, zu der die Quellprojekte gehören. Informationen zum Abrufen Ihrer Organisations-ID finden Sie unter Organisations-Ressourcen-ID abrufen.Ersetzen Sie
PROJECT_NUMBERS
durch die Nummern der Projekte, die Sie in das Dataset aufnehmen möchten. Sie können ein oder mehrere Projekte angeben. Projekte müssen als Liste von Strings angegeben werden.Alternativ können Sie eine Organisation oder einen oder mehrere Ordner hinzufügen, die Buckets und Objekte enthalten, für die Sie die Metadaten aktualisieren möchten. Wenn Sie Ordner oder Organisationen einbeziehen möchten, verwenden Sie das Feld
sourceFolders
bzw.organizationScope
. Weitere Informationen finden Sie in der Referenz zuDatasetConfig
.RETENTION_PERIOD_DAYS
mit der Anzahl der Tage, die im Dataset-Snapshot erfasst werden sollen. Beispiel:90
IDENTITY_TYPE
mit dem Typ des Dienstkontos, das zusammen mit der Dataset-Konfiguration erstellt wird. Mögliche Werte sindIDENTITY_TYPE_PER_CONFIG
undIDENTITY_TYPE_PER_PROJECT
.
Verwenden Sie zum Erstellen der Dataset-Konfiguration
cURL
, um die JSON API mit einerCreate
-DatasetConfig-Anfrage aufzurufen:curl -X POST --data-binary @JSON_FILE_NAME \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs?datasetConfigId=DATASET_CONFIG_ID" \ --header "Authorization: Bearer ACCESS_TOKEN" \ --header "Accept: application/json" \ --header "Content-Type: application/json"
Ersetzen Sie:
JSON_FILE_NAME
durch den Pfad zur JSON-Datei, die Sie im vorherigen Schritt erstellt haben. Alternativ können Sie eine Instanz vonDatasetConfig
im Anfragetext übergeben.PROJECT_ID
mit der ID des Projekts, zu dem die Dataset-Konfiguration und das Dataset gehören.LOCATION
mit dem Speicherort, an dem sich das Dataset und die Dataset-Konfiguration befinden. Beispiel:us-central1
.DATASET_CONFIG_ID
durch den Namen, den Sie der Datasetkonfiguration geben möchten. Namen werden als Kennung von Dataset-Konfigurationen verwendet und sind nicht unveränderlich. Der Name kann bis zu 128 Zeichen mit Buchstaben, Ziffern und Unterstrichen enthalten. Der Name muss mit einem Buchstaben beginnen.ACCESS_TOKEN
durch das Zugriffstoken, das Sie beim Installieren und Initialisieren der Google Cloud CLI generiert haben.
Informationen zur Fehlerbehebung bei Fehlern bei der Verarbeitung von Snapshots, die in error_attributes_view
protokolliert werden, finden Sie unter Fehler im Storage Insights-Dataset.
Erforderliche Berechtigungen für den Dienst-Agent erteilen
Google Cloud erstellt in Ihrem Namen einen konfigurationsbezogenen oder projektbezogenen Dienst-Agent, wenn Sie eine Dataset-Konfiguration erstellen. Der Dienst-Agent folgt dem Namensformat service-PROJECT_NUMBER@gcp-sa-storageinsights.iam.gserviceaccount.com
und wird auf der IAM-Seite der Google Cloud Console angezeigt, wenn Sie das Kästchen Von Google bereitgestellte Rollenzuweisungen einschließen auswählen.
Sie können den Namen des Service-Agents auch abrufen, indem Sie die DatasetConfig
-Ressource über die JSON API aufrufen.
Bitten Sie Ihren Administrator, dem Dienst-Agent die Dienstrolle „Storage Insights Collector“ (roles/storage.insightsCollectorService
) für die Organisation zuzuweisen, die die Quellprojekte enthält, damit Storage Insights Datasets generieren und schreiben kann.
Diese Rolle muss jedem dienstkontobezogenen Dienst-Agent zugewiesen werden, der für jede Dataset-Konfiguration erstellt wird, aus der Sie Daten abrufen möchten. Wenn Sie einen projektbezogenen Dienst-Agent verwenden, muss diese Rolle nur einmal zugewiesen werden, damit der Dienst-Agent Datasets für alle Dataset-Konfigurationen im Projekt lesen und schreiben kann.
Eine Anleitung zum Zuweisen von Rollen für Projekte finden Sie unter Zugriff verwalten.
Dataset verknüpfen
So verknüpfen Sie ein Dataset mit BigQuery:
Console
- Wechseln Sie in der Google Cloud Console zur Seite Storage Insights von Cloud Storage.
Klicken Sie auf den Namen der Datasetkonfiguration, mit der das Dataset generiert wurde, das Sie verknüpfen möchten.
Klicken Sie im Bereich Mit BigQuery verknüpftes Dataset auf Dataset verknüpfen, um Ihr Dataset zu verknüpfen.
Befehlszeile
Um ein Dataset mit BigQuery zu verknüpfen, führen Sie den Befehl
gcloud storage insights dataset-configs create-link
aus:gcloud storage insights dataset-configs create-link DATASET_CONFIG_ID --location=LOCATION
Ersetzen Sie:
Ersetzen Sie
DATASET_CONFIG_ID
durch den Namen der Dataset-Konfiguration, mit der das Dataset generiert wurde, das Sie verknüpfen möchten.LOCATION
durch den Standort Ihres Datasets. Beispiel:us-central1
Alternativ zur Angabe von
DATASET_CONFIG_NAME
undLOCATION
können Sie einen vollständigen Dataset-Konfigurationspfad angeben. Beispiel:gcloud storage insights dataset-configs create-link projects/DESTINATION_PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID_
Ersetzen Sie:
DESTINATION_PROJECT_ID
durch die ID des Projekts, das die Dataset-Konfiguration enthält. Weitere Informationen zu Projekt-IDs finden Sie unter Projekte erstellen und verwalten.Ersetzen Sie
DATASET_CONFIG_ID
durch den Namen der Dataset-Konfiguration, mit der das Dataset generiert wurde, das Sie verknüpfen möchten.LOCATION
durch den Speicherort Ihres Datasets und der Dataset-Konfiguration. Beispiel:us-central1
REST APIs
JSON API
Die gcloud CLI installieren und initialisieren, um ein Zugriffstoken für den Header
Authorization
zu generieren.Erstellen Sie eine JSON-Datei, die folgende Informationen enthält:
{ "name": "DATASET_NAME" }
Ersetzen Sie:
- Ersetzen Sie
DATASET_NAME
durch den Namen des Datasets, das Sie verknüpfen möchten. Beispiel:my_project.my_dataset276daa7e_2991_4f4f_b9d4_e354b48426a2
- Ersetzen Sie
Verwenden Sie
cURL
, um die JSON API mit einerlinkDataset
-DatasetConfig-Anfrage aufzurufen:curl --request POST --data-binary @JSON_FILE_NAME \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigsDATASET_CONFIG_ID:linkDataset?" \ --header "Authorization: Bearer ACCESS_TOKEN" \ --header "Accept: application/json" \ --header "Content-Type: application/json" \
Ersetzen Sie:
JSON_FILE_NAME
durch den Pfad zur JSON-Datei, die Sie im vorherigen Schritt erstellt haben.PROJECT_ID
durch die ID des Projekts, zu dem die Dataset-Konfiguration gehört.LOCATION
durch den Speicherort, an dem sich das Dataset und die Dataset-Konfiguration befinden. Beispiel:us-central1
.Ersetzen Sie
DATASET_CONFIG_ID
durch den Namen der Dataset-Konfiguration, mit der das Dataset generiert wurde, das Sie verknüpfen möchten.ACCESS_TOKEN
durch das Zugriffstoken, das Sie beim Installieren und Initialisieren der Google Cloud CLI generiert haben.
Verknüpfte Datasets ansehen und abfragen
So rufen Sie verknüpfte Datasets auf und fragen sie ab:
- Wechseln Sie in der Google Cloud Console zur Seite Storage Insights von Cloud Storage.
Eine Liste der Dataset-Konfigurationen, die in Ihrem Projekt erstellt wurden, wird angezeigt.
Klicken Sie auf das verknüpfte BigQuery-Dataset der Dataset-Konfiguration, die Sie aufrufen möchten.
Das verknüpfte BigQuery-Dataset wird in der Google Cloud Konsole angezeigt. Informationen zum Dataset-Schema der Metadaten finden Sie unter Dataset-Schema der Metadaten.
Sie können Tabellen und Ansichten in Ihren verknüpften Datasets genauso wie alle anderen BigQuery-Tabellen abfragen.
Verknüpfung eines Datasets aufheben
Wenn Sie verhindern möchten, dass die Dataset-Konfiguration im BigQuery-Dataset veröffentlicht wird, heben Sie die Verknüpfung des Datasets auf. So heben Sie die Verknüpfung eines Datasets auf:
Console
- Wechseln Sie in der Google Cloud Console zur Seite Storage Insights von Cloud Storage.
Klicken Sie auf den Namen der Datasetkonfiguration, mit der das Dataset generiert wurde, dessen Verknüpfung Sie aufheben möchten.
Klicken Sie im Bereich Mit BigQuery verknüpftes Dataset auf Dataset entknüpfen, um die Verknüpfung Ihres Datasets aufzuheben.
Befehlszeile
Führen Sie den Befehl
gcloud storage insights dataset-configs delete-link
aus, um die Verknüpfung des Datasets aufzuheben:gcloud storage insights dataset-configs delete-link DATASET_CONFIG_ID --location=LOCATION
Ersetzen Sie:
Ersetzen Sie
DATASET_CONFIG_ID
durch den Namen der Dataset-Konfiguration, mit der das Dataset generiert wurde, das Sie trennen möchten.LOCATION
durch den Speicherort Ihres Datasets und der Dataset-Konfiguration. Beispiel:us-central1
Alternativ zur Angabe von
DATASET_CONFIG_NAME
undLOCATION
können Sie einen vollständigen Dataset-Konfigurationspfad angeben. Beispiel:gcloud storage insights dataset-configs delete-link projects/DESTINATION_PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID
Ersetzen Sie:
DESTINATION_PROJECT_ID
durch die ID des Projekts, das die Dataset-Konfiguration enthält. Weitere Informationen zu Projekt-IDs finden Sie unter Projekte erstellen und verwalten.Ersetzen Sie
DATASET_CONFIG_ID
durch den Namen der Dataset-Konfiguration, mit der das Dataset generiert wurde, das Sie trennen möchten.LOCATION
durch den Speicherort Ihres Datasets und Ihrer Dataset-Konfiguration. Beispiel:us-central1
REST APIs
JSON API
Die gcloud CLI installieren und initialisieren, um ein Zugriffstoken für den Header
Authorization
zu generieren.Erstellen Sie eine JSON-Datei, die folgende Informationen enthält:
{ "name": "DATASET_NAME" }
Ersetzen Sie:
DATASET_NAME
durch den Namen des Datasets, dessen Verknüpfung Sie aufheben möchten. Beispiel:my_project.my_dataset276daa7e_2991_4f4f_b9d4_e354b48426a2
Verwenden Sie
cURL
, um die JSON API mit einerunlinkDataset
-DatasetConfig-Anfrage aufzurufen:curl --request POST --data-binary @JSON_FILE_NAME \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigsDATASET_CONFIG_ID:unlinkDataset?" \ --header "Authorization: Bearer ACCESS_TOKEN" \ --header "Accept: application/json" \ --header "Content-Type: application/json" \
Ersetzen Sie:
JSON_FILE_NAME
durch den Pfad zur JSON-Datei, die Sie im vorherigen Schritt erstellt haben.PROJECT_ID
durch die ID des Projekts, zu dem die Dataset-Konfiguration gehört.Ersetzen Sie
LOCATION
durch den Speicherort des Datasets und der Dataset-Konfiguration. Beispiel:us-central1
DATASET_CONFIG_ID
durch den Namen der Dataset-Konfiguration, mit der das Dataset generiert wurde, dessen Verknüpfung Sie aufheben möchten.ACCESS_TOKEN
durch das Zugriffstoken, das Sie beim Installieren und Initialisieren der Google Cloud CLI generiert haben.
Dataset-Konfiguration ansehen
So rufen Sie die Konfiguration eines Datasets auf:
Console
- Wechseln Sie in der Google Cloud Console zur Seite Storage Insights von Cloud Storage.
Klicken Sie auf den Namen der Datasetkonfiguration, die Sie aufrufen möchten.
Die Details der Dataset-Konfiguration werden angezeigt.
Befehlszeile
Führen Sie den Befehl
gcloud storage insights dataset-configs describe
aus, um eine Datasetkonfiguration zu beschreiben:gcloud storage insights dataset-configs describe DATASET_CONFG_ID \ --location=LOCATION
Ersetzen Sie:
DATASET_CONFIG_ID
durch den Namen der Dataset-Konfiguration.Ersetzen Sie
LOCATION
durch den Speicherort des Datasets und die Dataset-Konfiguration.
Alternativ zur Angabe von
DATASET_CONFIG_NAME
undLOCATION
können Sie einen vollständigen Dataset-Konfigurationspfad angeben. Beispiel:gcloud storage insights dataset-configs describe projects/DESTINATION_PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID
Ersetzen Sie:
DESTINATION_PROJECT_ID
durch die ID des Projekts, das die Dataset-Konfiguration enthält. Weitere Informationen zu Projekt-IDs finden Sie unter Projekte erstellen und verwalten.DATASET_CONFIG_ID
durch den Namen der Dataset-Konfiguration, mit der das Dataset generiert wurde, das Sie aufrufen möchten.LOCATION
durch den Speicherort Ihres Datasets und Ihrer Dataset-Konfiguration. Beispiel:us-central1
REST APIs
JSON API
Die gcloud CLI installieren und initialisieren, um ein Zugriffstoken für den Header
Authorization
zu generieren.Verwenden Sie
cURL
, um die JSON API mit einerGet
-DatasetConfig-Anfrage aufzurufen:curl -X GET \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID" \ --header "Authorization: Bearer ACCESS_TOKEN" \ --header "Accept: application/json" \ --header "Content-Type: application/json" \
Ersetzen Sie:
PROJECT_ID
durch die ID des Projekts, zu dem die Dataset-Konfiguration gehört.Ersetzen Sie
LOCATION
durch den Speicherort des Datasets und der Dataset-Konfiguration. Beispiel:us-central1
DATASET_CONFIG_ID
durch den Namen der Dataset-Konfiguration.ACCESS_TOKEN
durch das Zugriffstoken, das Sie beim Installieren und Initialisieren der Google Cloud CLI generiert haben.
Dataset-Konfigurationen auflisten
So listen Sie die Dataset-Konfigurationen in einem Projekt auf:
Console
- Wechseln Sie in der Google Cloud Console zur Seite Storage Insights von Cloud Storage.
Die Liste der Dataset-Konfigurationen wird angezeigt.
Befehlszeile
Führen Sie den Befehl
gcloud storage insights dataset-configs list
aus, um die Dataset-Konfigurationen in einem Projekt aufzulisten:gcloud storage insights dataset-configs list --location=LOCATION
Ersetzen Sie:
- Ersetzen Sie
LOCATION
durch den Speicherort des Datasets und der Dataset-Konfiguration. Beispiel:us-central1
Mit den folgenden optionalen Flags können Sie das Verhalten des Auflistungsaufrufs angeben:
Mit
--page-size
können Sie die maximale Anzahl der Ergebnisse angeben, die pro Seite zurückgegeben werden sollen.Verwenden Sie
--filter=FILTER
, um die Ergebnisse zu filtern. Weitere Informationen zur Verwendung des Flags--filter
erhalten Sie, wenn Siegcloud topic filters
ausführen und die Dokumentation lesen.Verwenden Sie
--sort-by=SORT_BY_VALUE
, um eine durch Kommas getrennte Liste von Schlüsselnamen für Ressourcenfelder anzugeben, nach denen sortiert werden soll. Beispiel:--sort-by=DATASET_CONFIG_NAME
.
- Ersetzen Sie
REST APIs
JSON API
Die gcloud CLI installieren und initialisieren, um ein Zugriffstoken für den Header
Authorization
zu generieren.Verwenden Sie
cURL
, um die JSON API mit einerGet
-DatasetConfig-Anfrage aufzurufen:curl -X GET \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs" \ --header "Authorization: Bearer ACCESS_TOKEN" \ --header "Accept: application/json" \ --header "Content-Type: application/json" \
Ersetzen Sie:
PROJECT_ID
durch die ID des Projekts, zu dem die Dataset-Konfiguration gehört.Ersetzen Sie
LOCATION
durch den Speicherort des Datasets und der Dataset-Konfiguration. Beispiel:us-central1
ACCESS_TOKEN
durch das Zugriffstoken, das Sie beim Installieren und Initialisieren der Google Cloud CLI generiert haben.
Dataset-Konfiguration aktualisieren
So aktualisieren Sie eine Dataset-Konfiguration:
Console
- Wechseln Sie in der Google Cloud Console zur Seite Storage Insights von Cloud Storage.
Klicken Sie auf den Namen der Dataset-Konfiguration, die Sie aktualisieren möchten.
Klicken Sie auf dem Tab Dataset-Konfiguration, der angezeigt wird, auf Bearbeiten
, um die Felder zu aktualisieren.
Befehlszeile
Führen Sie den Befehl
gcloud storage insights dataset-configs update
aus, um eine Datasetkonfiguration zu aktualisieren:gcloud storage insights dataset-configs update DATASET_CONFG_ID \ --location=LOCATION
Ersetzen Sie:
DATASET_CONFIG_ID
durch den Namen der Dataset-Konfiguration.LOCATION
mit dem Speicherort des Datasets und der Dataset-Konfiguration.
Mit den folgenden Flags können Sie die Attribute der Dataset-Konfiguration aktualisieren:
Verwenden Sie
--skip-verification
, um Prüfungen und Fehler aus dem Bestätigungsprozess zu überspringen. Dazu gehören auch Prüfungen für erforderliche IAM-Berechtigungen. Wenn sie verwendet werden, werden einige oder alle Buckets möglicherweise aus dem Dataset ausgeschlossen.Mit
--retention-period-days=DAYS
können Sie die Anzahl der Tage für den gleitenden Zeitraum angeben, für den Daten im Dataset-Snapshot erfasst werden sollen. Beispiel:90
Verwenden Sie
--description=DESCRIPTION
, um eine Beschreibung für die Dataset-Konfiguration zu erstellen.
REST APIs
JSON API
Die gcloud CLI installieren und initialisieren, um ein Zugriffstoken für den Header
Authorization
zu generieren.Erstellen Sie eine JSON-Datei, die die folgenden optionalen Informationen enthält:
{ "organization_number": "ORGANIZATION_ID", "source_projects": { "project_numbers": "PROJECT_NUMBERS" }, "retention_period_days": RETENTION_PERIOD" }
Ersetzen Sie:
ORGANIZATION_ID
mit der Ressourcen-ID der Organisation ersetzen, zu der die Quellprojekte gehören.PROJECT_NUMBERS
durch die Projektnummern, die Sie in das Dataset aufnehmen möchten. Sie können ein oder mehrere Projekte angeben. Projekte müssen in Listenform angegeben werden.RETENTION_PERIOD
mit der gleitenden Anzahl von Tagen an Daten, die im Dataset-Snapshot erfasst werden sollen. Beispiel:90
Um die Dataset-Konfiguration zu aktualisieren, verwenden Sie
cURL
, um die JSON API mit einerPatch
-DatasetConfig-Anfrage aufzurufen:curl -X PATCH --data-binary @JSON_FILE_NAME \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID?updateMask=RETENTION_PERIOD" \ --header "Authorization: Bearer ACCESS_TOKEN" \ --header "Accept: application/json" \ --header "Content-Type: application/json" \
Ersetzen Sie:
JSON_FILE_NAME
durch den Pfad zur JSON-Datei, die Sie im vorherigen Schritt erstellt haben.PROJECT_ID
durch die ID des Projekts, zu dem die Dataset-Konfiguration gehört.Ersetzen Sie
LOCATION
durch den Speicherort des Datasets und der Dataset-Konfiguration. Beispiel:us-central1
DATASET_CONFIG_ID
durch den Namen der Dataset-Konfiguration, die Sie aktualisieren möchten.RETENTION_PERIOD
mit der gleitenden Anzahl von Tagen an Daten, die im Dataset-Snapshot erfasst werden sollen. Beispiel:90
ACCESS_TOKEN
durch das Zugriffstoken, das Sie beim Installieren und Initialisieren der Google Cloud CLI generiert haben.
Dataset-Konfiguration löschen
So löschen Sie eine Dataset-Konfiguration:
Console
- Wechseln Sie in der Google Cloud Console zur Seite Storage Insights von Cloud Storage.
Klicken Sie auf den Namen der Datasetkonfiguration, die Sie löschen möchten.
Klicken Sie auf Löschen
.
Befehlszeile
Führen Sie den Befehl
gcloud storage insights dataset-configs delete
aus, um eine Dataset-Konfiguration zu löschen:gcloud storage insights dataset-configs delete DATASET_CONFG_ID \ --location=LOCATION
Ersetzen Sie:
DATASET_CONFIG_ID
durch den Namen der Dataset-Konfiguration, die Sie löschen möchten.Ersetzen Sie
LOCATION
durch den Speicherort des Datasets und der Dataset-Konfiguration. Beispiel:us-central1
Mit den folgenden Flags können Sie die Attribute der Dataset-Konfiguration aktualisieren:
Verwenden Sie
--auto-delete-link
, um die Verknüpfung des Datasets aufzuheben, das aus der Dataset-Konfiguration generiert wurde, die Sie löschen möchten. Sie müssen die Verknüpfung eines Datasets aufheben, bevor Sie die Dataset-Konfiguration löschen können, mit der das Dataset erstellt wurde.Mit
--retention-period-days=DAYS
geben Sie an, wie viele Tage mit Daten im Dataset-Snapshot erfasst werden sollen. Beispiel:90
Alternativ zur Angabe von
DATASET_CONFIG_NAME
undLOCATION
können Sie einen vollständigen Dataset-Konfigurationspfad angeben. Beispiel:gcloud storage insights dataset-configs describe projects/DESTINATION_PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID
REST APIs
JSON API
Die gcloud CLI installieren und initialisieren, um ein Zugriffstoken für den Header
Authorization
zu generieren.Verwenden Sie
cURL
, um die JSON API mit einerDelete
-DatasetConfig-Anfrage aufzurufen:curl -X DELETE \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID" \ --header "Authorization: Bearer ACCESS_TOKEN" \ --header "Accept: application/json" \ --header "Content-Type: application/json" \
Ersetzen Sie:
PROJECT_ID
durch die ID des Projekts, zu dem die Dataset-Konfiguration gehört.Ersetzen Sie
LOCATION
durch den Speicherort des Datasets und der Dataset-Konfiguration. Beispiel:us-central1
DATASET_CONFIG_ID
durch den Namen der Dataset-Konfiguration, die Sie löschen möchten.ACCESS_TOKEN
durch das Zugriffstoken, das Sie beim Installieren und Initialisieren der Google Cloud CLI generiert haben.
Nächste Schritte
- Verknüpfte Datasets aufrufen
- Verknüpftes Dataset abfragen
- Gespeicherte Daten mit Unterstützung durch Gemini analysieren