Auf dieser Seite erfahren Sie, wie Sie Storage Insights-Datasets und Datasetkonfigurationen erstellen und verwalten. Weitere Informationen zu Storage Insights-Datasets
Hinweise
Bevor Sie mit dem Erstellen und Verwalten von Datasets und Datasetkonfigurationen beginnen, folgen Sie der Anleitung in den folgenden Abschnitten.
Erforderliche Rollen abrufen
Bitten Sie Ihren Administrator, Ihnen die folgenden IAM-Rollen für Ihre Quellprojekte zuzuweisen, um die Berechtigungen zu erhalten, die Sie zum Erstellen und Verwalten von Datasets benötigen:
-
So erstellen, verwalten und rufen Sie Datasetkonfigurationen auf:
Storage Insights Admin (
roles/storageinsights.admin
) -
So rufen Sie Datasets auf, verknüpfen sie und heben die Verknüpfung auf:
-
Storage Insights Analyst (
roles/storageinsights.analyst
) -
BigQuery-Administrator (
roles/bigquery.admin
)
-
Storage Insights Analyst (
-
So löschen Sie verknüpfte Datasets:
BigQuery-Administrator (
roles/bigquery.admin
) -
So rufen Sie Datasets in BigQuery auf und stellen Abfragen:
-
Storage Insights-Betrachter (
roles/storageinsights.viewer
) -
BigQuery Jobnutzer (
roles/bigquery.jobUser
) -
BigQuery-Datenbetrachter (
roles/bigquery.dataViewer
)
-
Storage Insights-Betrachter (
Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.
Diese vordefinierten Rollen enthalten die Berechtigungen, die zum Erstellen und Verwalten von Datasets erforderlich sind. Erweitern Sie den Abschnitt Erforderliche Berechtigungen, um die erforderlichen Berechtigungen anzuzeigen:
Erforderliche Berechtigungen
Die folgenden Berechtigungen sind erforderlich, um Datensätze zu erstellen und zu verwalten:
-
Dataset-Konfiguration erstellen:
storageinsights.datasetConfigs.create
-
Dataset-Konfiguration ansehen:
-
storageinsights.datasetConfigs.get
-
storageinsights.datasetConfigs.list
-
-
Dataset-Konfiguration verwalten:
-
storageinsights.datasetConfigs.update
-
storageinsights.datasetConfigs.delete
-
-
Verknüpfung mit BigQuery-Dataset:
storageinsights.datasetConfigs.linkDataset
-
Verknüpfung mit BigQuery-Dataset aufheben:
storageinsights.datasetConfigs.unlinkDataset
-
Mit BigQuery verknüpfte Datasets abfragen:
bigquery.jobs.create or bigquery.jobs.*
Sie können diese Berechtigungen auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.
Storage Insights API aktivieren
Console
Befehlszeile
Führen Sie den folgenden Befehl aus, um die Storage Insights API in Ihrem aktuellen Projekt zu aktivieren:
gcloud services enable storageinsights.googleapis.com
Weitere Informationen zum Aktivieren von Diensten für ein Google Cloud-Projekt finden Sie unter Dienste aktivieren und deaktivieren.
Storage Intelligence konfigurieren
Speicher-KI muss für das Projekt, den Ordner oder die Organisation konfiguriert sein, die Sie mit Datensätzen analysieren möchten.
Dataset-Konfiguration erstellen
So erstellen Sie eine Datensatzkonfiguration und generieren einen Datensatz: Weitere Informationen zu den Feldern, die Sie beim Erstellen der Dataset-Konfiguration angeben können, finden Sie unter Dataset-Konfigurationseigenschaften.
Console
- Rufen Sie in der Google Cloud Console die Seite Speicherstatistiken von Cloud Storage auf.
Klicken Sie auf Dataset konfigurieren.
Geben Sie im Abschnitt Dataset benennen einen Namen für das Dataset ein. Geben Sie optional eine Beschreibung für den Datensatz ein.
Gehen Sie im Abschnitt Datensatzumfang definieren so vor:
Wählen Sie eine der folgenden Optionen aus:
Wenn Sie Speichermetadaten für alle Projekte in der aktuellen Organisation abrufen möchten, wählen Sie Organisation einbeziehen aus.
Wenn Sie Speichermetadaten für alle Projekte in den ausgewählten Ordnern abrufen möchten, wählen Sie Ordner einschließen(Unterorganisation/Abteilungen) aus. Informationen zum Abrufen von Ordner-IDs finden Sie unter Ordner und Projekte anzeigen oder auflisten. So fügen Sie Ordner hinzu:
- Geben Sie im Feld Ordner 1 die Ordner-ID ein.
- Optional: Wenn Sie mehrere Ordner-IDs hinzufügen möchten, klicken Sie auf + Weiteren Ordner hinzufügen.
Wenn Sie Speichermetadaten für die ausgewählten Projekte abrufen möchten, wählen Sie Projekte durch Angabe der Projektnummern einschließen aus. Informationen zum Ermitteln der Projektnummern finden Sie unter Projektname, -nummer und -ID ermitteln. So fügen Sie Projekte hinzu:
- Geben Sie im Feld Projekt 1 die Projektnummer ein.
- Optional: Wenn Sie mehrere Projektnummern hinzufügen möchten, klicken Sie auf + Weiteres Projekt hinzufügen.
Wenn Sie mehrere Projekte oder Ordner gleichzeitig hinzufügen möchten, wählen Sie Liste mit Projekten /Ordnern über CSV-Datei hochladen aus. Die CSV-Datei muss die Projektnummern oder Ordner-IDs enthalten, die Sie in den Datensatz aufnehmen möchten.
Geben Sie an, ob zukünftige Buckets automatisch in die ausgewählte Ressource aufgenommen werden sollen.
Wenn Sie Filter für Buckets basierend auf Regionen und Bucket-Präfixen angeben möchten, maximieren Sie den Bereich Filter (optional). Filter werden additiv auf Bucket angewendet.
Sie können Buckets aus bestimmten Regionen ein- oder ausschließen. Sie können beispielsweise Buckets in den Regionen
me-central1
undme-central2
ausschließen. Sie können Buckets auch nach Präfix ein- oder ausschließen. Wenn Sie beispielsweise Buckets ausschließen möchten, die mitmy-bucket
beginnen, geben Sie das Präfixmy-bucket*
ein.
Klicken Sie auf Weiter.
Wählen Sie im Abschnitt Aufbewahrungsdauer auswählen eine Aufbewahrungsdauer für die Daten im Datensatz aus.
Wählen Sie im Abschnitt Ort zum Speichern des konfigurierten Datasets auswählen einen Speicherort für das Dataset und die Datasetkonfiguration aus.
Wählen Sie im Abschnitt Dienstkontotyp auswählen einen Dienstagententyp für Ihren Datensatz aus. Dieser Dienst-Agent wird in Ihrem Namen erstellt, wenn Sie die Datensatzkonfiguration erstellen. Sie können einen der folgenden Kundenservicemitarbeiter auswählen:
- Dienstkonto auf Konfigurationsebene: Dieser Dienst-Agent kann nur auf den Datensatz zugreifen und ihn schreiben, der von der jeweiligen Datensatzkonfiguration generiert wurde.
- Dienstkonto auf Projektebene: Dieser Dienst-Agent kann auf Datasets zugreifen und sie schreiben, die aus allen Datasetkonfigurationen im Projekt generiert werden.
Beim Erstellen des Dienst-Agents müssen Sie ihm die erforderlichen Berechtigungen erteilen. Weitere Informationen zu diesen Dienstmitarbeitern finden Sie unter Dataset-Konfigurationseigenschaften.
Klicken Sie auf Konfigurieren.
Befehlszeile
Führen Sie den Befehl
gcloud storage insights dataset-configs create
mit den erforderlichen Flags aus, um eine Datensatzkonfiguration zu erstellen:gcloud storage insights dataset-configs create DATASET_CONFG_ID \ --source-projects=SOURCE_PROJECT_NUMBERS \ --location=LOCATION \ --retention-period-days=RETENTION_PERIOD_DAYS \ --organization=ORGANIZATION_ID
Ersetzen Sie:
DATASET_CONFIG_ID
durch den Namen, den Sie der Dataset-Konfiguration geben möchten. Namen werden als Kennung von Datensatzkonfigurationen verwendet und können geändert werden. Der Name kann bis zu 128 Zeichen mit Buchstaben, Ziffern und Unterstrichen enthalten.SOURCE_PROJECT_NUMBERS
durch die Nummern der Projekte ersetzen, die Sie in den Datensatz aufnehmen möchten. Beispiel:464036093014
Sie können ein oder mehrere Projekte angeben. Informationen zum Ermitteln der Projektnummer finden Sie unter Projektname, -nummer und -ID ermitteln.Alternativ zum Flag
--source-projects
können Sie das Flag--source-projects-file=FILE_PATH
verwenden. Damit können Sie mehrere Projektnummern gleichzeitig angeben, indem Sie eine Datei mit den Projektnummern hochladen. Die Datei muss im CSV-Format vorliegen und in Cloud Storage hochgeladen werden.LOCATION
durch den Speicherort, an dem die Datensatzkonfiguration und der Datensatz gespeichert werden.RETENTION_PERIOD_DAYS
mit der Aufbewahrungsdauer für die Daten im Datensatz.ORGANIZATION_ID
durch die Ressourcen-ID der Organisation ersetzen, zu der die Quellprojekte gehören. Quellprojekte außerhalb des angegebenen Speicherorts werden von der Dataset-Konfiguration ausgeschlossen. Informationen zum Abrufen Ihrer Organisations-ID finden Sie unter Ressourcen-ID Ihrer Organisation abrufen.
Optional können Sie zusätzliche Flags verwenden, um den Datensatz weiter zu konfigurieren:
Verwenden Sie
--include-buckets=BUCKET_NAMES_OR_REGEX
, um bestimmte Buckets nach Name oder regulärem Ausdruck einzuschließen. Wenn dieses Flag verwendet wird, kann--exclude-buckets
nicht verwendet werden.Verwenden Sie
--exclude-buckets=BUCKET_NAMES_OR_REGEX
, um bestimmte Buckets nach Name oder regulärem Ausdruck auszuschließen. Wenn dieses Flag verwendet wird, kann--include-buckets
nicht verwendet werden.Mit
--project=DESTINATION_PROJECT_ID
können Sie ein Projekt angeben, in dem die Dataset-Konfiguration und das generierte Dataset gespeichert werden sollen. Wenn dieses Flag nicht verwendet wird, ist das Zielprojekt Ihr aktives Projekt. Weitere Informationen zu Projekt-IDs finden Sie unter Projekte erstellen und verwalten.Mit
--auto-add-new-buckets
können Sie alle Buckets automatisch einschließen, die in Zukunft zu Quellprojekten hinzugefügt werden.Mit
--skip-verification
können Sie Prüfungen und Fehler im Überprüfungsprozess überspringen, einschließlich Prüfungen auf erforderliche IAM-Berechtigungen. Wenn Sie verwendet werden, werden einige oder alle Bucket möglicherweise aus dem Datensatz ausgeschlossen.Mit
--identity=IDENTITY_TYPE
können Sie den Typ des Dienst-Agenten angeben, der zusammen mit der Datensatzkonfiguration erstellt wird. Mögliche Werte sindIDENTITY_TYPE_PER_CONFIG
undIDENTITY_TYPE_PER_PROJECT
. Wenn nicht angegeben, lautet die StandardeinstellungIDENTITY_TYPE_PER_CONFIG
.Verwenden Sie
--description=DESCRIPTION
, um eine Beschreibung für die Datensatzkonfiguration zu verfassen.
REST APIs
JSON API
Die gcloud CLI installieren und initialisieren, um ein Zugriffstoken für den Header
Authorization
zu generieren.Erstellen Sie eine JSON-Datei, die folgende Informationen enthält:
{ "organization_number": "ORGANIZATION_ID", "source_projects": { "project_numbers": ["PROJECT_NUMBERS", ...] }, "retention_period_days": "RETENTION_PERIOD_DAYS", "identity": { "type": "IDENTITY_TYPE" } }
Ersetzen Sie:
ORGANIZATION_ID
durch die Ressourcen-ID der Organisation ersetzen, zu der die Quellprojekte gehören. Informationen zum Abrufen Ihrer Organisations-ID finden Sie unter Ressourcen-ID Ihrer Organisation abrufen.PROJECT_NUMBERS
durch die Nummern der Projekte ersetzen, die Sie in das Dataset aufnehmen möchten. Sie können ein oder mehrere Projekte angeben. Projekte müssen als Liste von Strings angegeben werden.RETENTION_PERIOD_DAYS
mit der Anzahl der Tage, für die Daten im Dataset-Snapshot erfasst werden sollen. Beispiel:90
IDENTITY_TYPE
mit dem Typ des Dienstkontos, das zusammen mit der Datensatzkonfiguration erstellt wird. Mögliche Werte sindIDENTITY_TYPE_PER_CONFIG
undIDENTITY_TYPE_PER_PROJECT
.
Verwenden Sie
cURL
, um die JSON API mit einerCreate
-DatasetConfig-Anfrage aufzurufen, um die Datensatzkonfiguration zu erstellen:curl -X POST --data-binary @JSON_FILE_NAME \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs?datasetConfigId=DATASET_CONFIG_ID" \ --header "Authorization: Bearer ACCESS_TOKEN" \ --header "Accept: application/json" \ --header "Content-Type: application/json"
Ersetzen Sie:
JSON_FILE_NAME
durch den Pfad zur JSON-Datei, die Sie im vorherigen Schritt erstellt haben. Alternativ kannst du eine Instanz vonDatasetConfig
im Anfragetext übergeben.PROJECT_ID
durch die ID des Projekts ersetzen, zu dem die Dataset-Konfiguration und das Dataset gehören.LOCATION
durch den Speicherort, an dem sich das Dataset und die Datasetkonfiguration befinden. Beispiel:us-central1
.DATASET_CONFIG_ID
durch den Namen, den Sie der Datensatzkonfiguration geben möchten. Namen werden als Kennung von Datensatzkonfigurationen verwendet und sind unveränderlich. Der Name kann bis zu 128 Zeichen mit Buchstaben, Ziffern und Unterstrichen enthalten. Der Name muss mit einem Buchstaben beginnen.ACCESS_TOKEN
mit dem Zugriffstoken, das Sie beim Installieren und Initialisieren der Google Cloud CLI generiert haben.
Informationen zur Behebung von Fehlern bei der Snapshot-Verarbeitung, die in error_attributes_view
protokolliert werden, finden Sie unter Storage Insights-Dataset-Fehler.
Dem Dienst-Agent die erforderlichen Berechtigungen erteilen
Google Cloud erstellt in Ihrem Namen einen Dienst-Agenten auf Konfigurations- oder Projektebene, wenn Sie eine Datensatzkonfiguration erstellen. Der Dienst-Agent folgt dem Namensformat service-PROJECT_NUMBER@gcp-sa-storageinsights.iam.gserviceaccount.com
und wird auf der IAM-Seite der Google Cloud Console angezeigt, wenn Sie das Kästchen Von Google bereitgestellte Rollenzuweisungen aktivieren.
Sie können den Namen des Kundenservicemitarbeiters auch über die JSON API in der Ressource DatasetConfig
abrufen.
Damit Storage Insights Datensätze generieren und schreiben kann, bitten Sie Ihren Administrator, dem Dienst-Agent die Rolle „Storage Insights Collector Service“ (roles/storage.insightsCollectorService
) für die Organisation zuzuweisen, die die Quellprojekte enthält.
Diese Rolle muss jedem Dienst-Agent auf Konfigurationsebene gewährt werden, der für jede Dataset-Konfiguration erstellt wird, aus der Sie Daten abrufen möchten. Wenn Sie einen Dienst-Agenten auf Projektebene verwenden, muss diese Rolle nur einmal gewährt werden, damit der Dienst-Agent Datasets für alle Datasetkonfigurationen im Projekt lesen und schreiben kann.
Eine Anleitung zum Zuweisen von Rollen für Projekte finden Sie unter Zugriff verwalten.
Dataset verknüpfen
So verknüpfen Sie ein Dataset mit BigQuery:
Console
- Rufen Sie in der Google Cloud Console die Seite Speicher-Insights von Cloud Storage auf.
Klicken Sie auf den Namen der Datensatzkonfiguration, mit der der Datensatz generiert wurde, den Sie verknüpfen möchten.
Klicken Sie im Bereich Mit BigQuery verknüpftes Dataset auf Dataset verknüpfen, um das Dataset zu verknüpfen.
Befehlszeile
Wenn Sie ein Dataset mit BigQuery verknüpfen möchten, führen Sie den Befehl
gcloud storage insights dataset-configs create-link
aus:gcloud storage insights dataset-configs create-link DATASET_CONFIG_ID --location=LOCATION
Ersetzen Sie:
DATASET_CONFIG_ID
durch den Namen der Datasetkonfiguration ersetzen, mit der das Dataset generiert wurde, das Sie verknüpfen möchten.LOCATION
durch den Speicherort Ihres Datasets. Beispiel:us-central1
Alternativ zu
DATASET_CONFIG_NAME
undLOCATION
können Sie auch einen vollständigen Pfad zur Datasetkonfiguration angeben. Beispiel:gcloud storage insights dataset-configs create-link projects/DESTINATION_PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID_
Ersetzen Sie:
DESTINATION_PROJECT_ID
durch die ID des Projekts ersetzen, das die Datasetkonfiguration enthält. Weitere Informationen zu Projekt-IDs finden Sie unter Projekte erstellen und verwalten.DATASET_CONFIG_ID
durch den Namen der Datasetkonfiguration ersetzen, mit der das Dataset generiert wurde, das Sie verknüpfen möchten.LOCATION
durch den Speicherort Ihres Datasets und Ihrer Datasetkonfiguration. Beispiel:us-central1
REST APIs
JSON API
Die gcloud CLI installieren und initialisieren, um ein Zugriffstoken für den Header
Authorization
zu generieren.Erstellen Sie eine JSON-Datei, die folgende Informationen enthält:
{ "name": "DATASET_NAME" }
Ersetzen Sie:
DATASET_NAME
durch den Namen des Datasets, das Sie verknüpfen möchten. Beispiel:my_project.my_dataset276daa7e_2991_4f4f_b9d4_e354b48426a2
Verwenden Sie
cURL
, um die JSON API mit einerlinkDataset
-DatasetConfig-Anfrage aufzurufen:curl --request POST --data-binary @JSON_FILE_NAME \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigsDATASET_CONFIG_ID:linkDataset?" \ --header "Authorization: Bearer ACCESS_TOKEN" \ --header "Accept: application/json" \ --header "Content-Type: application/json" \
Ersetzen Sie:
JSON_FILE_NAME
durch den Pfad zur JSON-Datei, die Sie im vorherigen Schritt erstellt haben.PROJECT_ID
durch die ID des Projekts ersetzen, zu dem die Dataset-Konfiguration gehört.LOCATION
durch den Speicherort ersetzen, an dem sich der Datensatz und die Datensatzkonfiguration befinden. Beispiel:us-central1
.DATASET_CONFIG_ID
durch den Namen der Dataset-Konfiguration ersetzen, mit der das Dataset generiert wurde, das Sie verknüpfen möchten.ACCESS_TOKEN
mit dem Zugriffstoken, das Sie beim Installieren und Initialisieren der Google Cloud CLI generiert haben.
Verknüpfte Datasets aufrufen und abfragen
So rufen Sie verknüpfte Datasets auf und fragen sie ab:
- Rufen Sie in der Google Cloud Console die Seite Speicher-Insights von Cloud Storage auf.
Eine Liste der Datasetkonfigurationen, die in Ihrem Projekt erstellt wurden, wird angezeigt.
Klicken Sie auf das verknüpfte BigQuery-Dataset der Datensatzkonfiguration, die Sie aufrufen möchten.
Das verknüpfte BigQuery-Dataset wird in der Google Cloud Console angezeigt. Informationen zum Dataset-Schema der Metadaten finden Sie unter Dataset-Schema der Metadaten.
Sie können Tabellen und Ansichten in Ihren verknüpften Datasets genauso wie alle anderen BigQuery-Tabellen abfragen.
Verknüpfung eines Datenpools aufheben
Wenn die Dataset-Konfiguration nicht mehr im BigQuery-Dataset veröffentlicht werden soll, heben Sie die Verknüpfung mit dem Dataset auf. So heben Sie die Verknüpfung eines Datensatzes auf:
Console
- Rufen Sie in der Google Cloud Console die Seite Speicherstatistiken von Cloud Storage auf.
Klicken Sie auf den Namen der Datensatzkonfiguration, mit der der Datensatz generiert wurde, dessen Verknüpfung Sie aufheben möchten.
Klicken Sie im Bereich Mit BigQuery verknüpftes Dataset auf Dataset verknüpfen, um die Verknüpfung aufzuheben.
Befehlszeile
Führen Sie den Befehl
gcloud storage insights dataset-configs delete-link
aus, um die Verknüpfung des Datensatzes aufzuheben:gcloud storage insights dataset-configs delete-link DATASET_CONFIG_ID --location=LOCATION
Ersetzen Sie:
DATASET_CONFIG_ID
durch den Namen der Datasetkonfiguration ersetzen, mit der das Dataset generiert wurde, dessen Verknüpfung Sie aufheben möchten.LOCATION
durch den Speicherort Ihres Datasets und Ihrer Datasetkonfiguration. Beispiel:us-central1
Alternativ zu
DATASET_CONFIG_NAME
undLOCATION
können Sie auch einen vollständigen Pfad zur Datasetkonfiguration angeben. Beispiel:gcloud storage insights dataset-configs delete-link projects/DESTINATION_PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID
Ersetzen Sie:
DESTINATION_PROJECT_ID
durch die ID des Projekts ersetzen, das die Datasetkonfiguration enthält. Weitere Informationen zu Projekt-IDs finden Sie unter Projekte erstellen und verwalten.DATASET_CONFIG_ID
durch den Namen der Datasetkonfiguration ersetzen, mit der das Dataset generiert wurde, dessen Verknüpfung Sie aufheben möchten.LOCATION
durch den Speicherort Ihres Datasets und Ihrer Datasetkonfiguration. Beispiel:us-central1
REST APIs
JSON API
Die gcloud CLI installieren und initialisieren, um ein Zugriffstoken für den Header
Authorization
zu generieren.Erstellen Sie eine JSON-Datei, die folgende Informationen enthält:
{ "name": "DATASET_NAME" }
Ersetzen Sie:
DATASET_NAME
durch den Namen des Datasets, dessen Verknüpfung Sie aufheben möchten. Beispiel:my_project.my_dataset276daa7e_2991_4f4f_b9d4_e354b48426a2
Verwenden Sie
cURL
, um die JSON API mit einerunlinkDataset
-DatasetConfig-Anfrage aufzurufen:curl --request POST --data-binary @JSON_FILE_NAME \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigsDATASET_CONFIG_ID:unlinkDataset?" \ --header "Authorization: Bearer ACCESS_TOKEN" \ --header "Accept: application/json" \ --header "Content-Type: application/json" \
Ersetzen Sie:
JSON_FILE_NAME
durch den Pfad zur JSON-Datei, die Sie im vorherigen Schritt erstellt haben.PROJECT_ID
durch die ID des Projekts ersetzen, zu dem die Dataset-Konfiguration gehört.LOCATION
durch den Speicherort des Datasets und der Datasetkonfiguration. Beispiel:us-central1
DATASET_CONFIG_ID
durch den Namen der Dataset-Konfiguration ersetzen, mit der das Dataset generiert wurde, dessen Verknüpfung Sie aufheben möchten.ACCESS_TOKEN
mit dem Zugriffstoken, das Sie beim Installieren und Initialisieren der Google Cloud CLI generiert haben.
Dataset-Konfiguration ansehen
So rufen Sie eine Datensatzkonfiguration auf:
Console
- Rufen Sie in der Google Cloud Console die Seite Speicher-Insights von Cloud Storage auf.
Klicken Sie auf den Namen der Datasetkonfiguration, die Sie aufrufen möchten.
Die Details zur Datensatzkonfiguration werden angezeigt.
Befehlszeile
Führen Sie den Befehl
gcloud storage insights dataset-configs describe
aus, um eine Datensatzkonfiguration zu beschreiben:gcloud storage insights dataset-configs describe DATASET_CONFG_ID \ --location=LOCATION
Ersetzen Sie:
DATASET_CONFIG_ID
durch den Namen der Datensatzkonfiguration.LOCATION
durch den Speicherort des Datasets und die Datasetkonfiguration.
Alternativ zu
DATASET_CONFIG_NAME
undLOCATION
können Sie auch einen vollständigen Pfad zur Datasetkonfiguration angeben. Beispiel:gcloud storage insights dataset-configs describe projects/DESTINATION_PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID
Ersetzen Sie:
DESTINATION_PROJECT_ID
durch die ID des Projekts ersetzen, das die Datasetkonfiguration enthält. Weitere Informationen zu Projekt-IDs finden Sie unter Projekte erstellen und verwalten.DATASET_CONFIG_ID
durch den Namen der Datasetkonfiguration, mit der das Dataset generiert wurde, das Sie aufrufen möchten.LOCATION
durch den Speicherort Ihres Datasets und Ihrer Datasetkonfiguration. Beispiel:us-central1
REST APIs
JSON API
Die gcloud CLI installieren und initialisieren, um ein Zugriffstoken für den Header
Authorization
zu generieren.Verwenden Sie
cURL
, um die JSON API mit einerGet
-DatasetConfig-Anfrage aufzurufen:curl -X GET \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID" \ --header "Authorization: Bearer ACCESS_TOKEN" \ --header "Accept: application/json" \ --header "Content-Type: application/json" \
Ersetzen Sie:
PROJECT_ID
durch die ID des Projekts ersetzen, zu dem die Dataset-Konfiguration gehört.LOCATION
durch den Speicherort des Datasets und der Datasetkonfiguration. Beispiel:us-central1
DATASET_CONFIG_ID
durch den Namen der Datensatzkonfiguration.ACCESS_TOKEN
mit dem Zugriffstoken, das Sie beim Installieren und Initialisieren der Google Cloud CLI generiert haben.
Dataset-Konfigurationen auflisten
So listen Sie die Datasetkonfigurationen in einem Projekt auf:
Console
- Rufen Sie in der Google Cloud Console die Seite Speicherstatistiken von Cloud Storage auf.
Die Liste der Datensatzkonfigurationen wird angezeigt.
Befehlszeile
Führen Sie den Befehl
gcloud storage insights dataset-configs list
aus, um die Datasetkonfigurationen in einem Projekt aufzulisten:gcloud storage insights dataset-configs list --location=LOCATION
Ersetzen Sie:
LOCATION
durch den Speicherort des Datasets und der Datasetkonfiguration. Beispiel:us-central1
Mit den folgenden optionalen Flags können Sie das Verhalten des Listenaufrufs angeben:
Mit
--page-size
können Sie die maximale Anzahl von Ergebnissen angeben, die pro Seite zurückgegeben werden sollen.Verwenden Sie
--filter=FILTER
, um Ergebnisse zu filtern. Weitere Informationen zur Verwendung des Flags--filter
finden Sie in der Dokumentation.gcloud topic filters
Mit
--sort-by=SORT_BY_VALUE
können Sie eine durch Kommas getrennte Liste von Schlüsselnamen für Ressourcenfelder angeben, nach denen sortiert werden soll. Beispiel:--sort-by=DATASET_CONFIG_NAME
.
REST APIs
JSON API
Die gcloud CLI installieren und initialisieren, um ein Zugriffstoken für den Header
Authorization
zu generieren.Verwenden Sie
cURL
, um die JSON API mit einerGet
-DatasetConfig-Anfrage aufzurufen:curl -X GET \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs" \ --header "Authorization: Bearer ACCESS_TOKEN" \ --header "Accept: application/json" \ --header "Content-Type: application/json" \
Ersetzen Sie:
PROJECT_ID
durch die ID des Projekts ersetzen, zu dem die Dataset-Konfiguration gehört.LOCATION
durch den Speicherort des Datasets und der Datasetkonfiguration. Beispiel:us-central1
ACCESS_TOKEN
mit dem Zugriffstoken, das Sie beim Installieren und Initialisieren der Google Cloud CLI generiert haben.
Dataset-Konfiguration aktualisieren
So aktualisieren Sie die Konfiguration eines Datensatzes:
Console
- Rufen Sie in der Google Cloud Console die Seite Speicherstatistiken von Cloud Storage auf.
Klicken Sie auf den Namen der Datasetkonfiguration, die Sie aktualisieren möchten.
Klicken Sie auf dem Tab Datensatzkonfiguration auf Bearbeiten
, um die Felder zu aktualisieren.
Befehlszeile
Führen Sie den Befehl
gcloud storage insights dataset-configs update
aus, um eine Datasetkonfiguration zu aktualisieren:gcloud storage insights dataset-configs update DATASET_CONFG_ID \ --location=LOCATION
Ersetzen Sie:
DATASET_CONFIG_ID
durch den Namen der Datensatzkonfiguration.LOCATION
durch den Speicherort und die Konfiguration des Datasets.
Mit den folgenden Flags können Sie Eigenschaften der Datensatzkonfiguration aktualisieren:
Mit
--skip-verification
können Sie Prüfungen und Fehler im Überprüfungsprozess überspringen, einschließlich Prüfungen auf erforderliche IAM-Berechtigungen. Wenn Sie verwendet werden, werden einige oder alle Bucket möglicherweise aus dem Datensatz ausgeschlossen.Mit
--retention-period-days=DAYS
können Sie die Anzahl der Tage an Daten angeben, die im Dataset-Snapshot erfasst werden sollen. Beispiel:90
Verwenden Sie
--description=DESCRIPTION
, um eine Beschreibung für die Datensatzkonfiguration zu verfassen.
REST APIs
JSON API
Die gcloud CLI installieren und initialisieren, um ein Zugriffstoken für den Header
Authorization
zu generieren.Erstellen Sie eine JSON-Datei mit den folgenden optionalen Informationen:
{ "organization_number": "ORGANIZATION_ID", "source_projects": { "project_numbers": "PROJECT_NUMBERS" }, "retention_period_days": RETENTION_PERIOD" }
Ersetzen Sie:
ORGANIZATION_ID
durch die Ressourcen-ID der Organisation ersetzen, zu der die Quellprojekte gehören.PROJECT_NUMBERS
durch die Projektnummern ersetzen, die Sie in das Dataset aufnehmen möchten. Sie können ein oder mehrere Projekte angeben. Projekte müssen in einem Listenformat angegeben werden.RETENTION_PERIOD
mit der Anzahl der Tage, deren Daten im Dataset-Snapshot erfasst werden sollen. Beispiel:90
Um die Datensatzkonfiguration zu aktualisieren, verwenden Sie
cURL
, um die JSON API mit einerPatch
-DatasetConfig-Anfrage aufzurufen:curl -X PATCH --data-binary @JSON_FILE_NAME \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID?updateMask=RETENTION_PERIOD" \ --header "Authorization: Bearer ACCESS_TOKEN" \ --header "Accept: application/json" \ --header "Content-Type: application/json" \
Ersetzen Sie:
JSON_FILE_NAME
durch den Pfad zur JSON-Datei, die Sie im vorherigen Schritt erstellt haben.PROJECT_ID
durch die ID des Projekts ersetzen, zu dem die Dataset-Konfiguration gehört.LOCATION
durch den Speicherort des Datasets und der Datasetkonfiguration. Beispiel:us-central1
DATASET_CONFIG_ID
durch den Namen der Datasetkonfiguration, die Sie aktualisieren möchten.RETENTION_PERIOD
mit der Anzahl der Tage, deren Daten im Dataset-Snapshot erfasst werden sollen. Beispiel:90
ACCESS_TOKEN
mit dem Zugriffstoken, das Sie beim Installieren und Initialisieren der Google Cloud CLI generiert haben.
Dataset-Konfiguration löschen
So löschen Sie eine Datensatzkonfiguration:
Console
- Rufen Sie in der Google Cloud Console die Seite Speicherstatistiken von Cloud Storage auf.
Klicken Sie auf den Namen der Datensatzkonfiguration, die Sie löschen möchten.
Klicken Sie auf Löschen
.
Befehlszeile
Führen Sie den Befehl
gcloud storage insights dataset-configs delete
aus, um eine Datasetkonfiguration zu löschen:gcloud storage insights dataset-configs delete DATASET_CONFG_ID \ --location=LOCATION
Ersetzen Sie:
DATASET_CONFIG_ID
durch den Namen der Datensatzkonfiguration, die Sie löschen möchten.LOCATION
durch den Speicherort des Datasets und der Datasetkonfiguration. Beispiel:us-central1
Mit den folgenden Flags können Sie Eigenschaften der Datensatzkonfiguration aktualisieren:
Verwenden Sie
--auto-delete-link
, um die Verknüpfung des Datasets aufzuheben, das aus der Dataset-Konfiguration generiert wurde, die Sie löschen möchten. Sie müssen die Verknüpfung eines Datasets aufheben, bevor Sie die Dataset-Konfiguration löschen können, mit der das Dataset generiert wurde.Mit
--retention-period-days=DAYS
können Sie angeben, wie viele Tage an Daten im Dataset-Snapshot erfasst werden sollen. Beispiel:90
Alternativ zu
DATASET_CONFIG_NAME
undLOCATION
können Sie auch einen vollständigen Pfad zur Datasetkonfiguration angeben. Beispiel:gcloud storage insights dataset-configs describe projects/DESTINATION_PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID
REST APIs
JSON API
Die gcloud CLI installieren und initialisieren, um ein Zugriffstoken für den Header
Authorization
zu generieren.Verwenden Sie
cURL
, um die JSON API mit einerDelete
-DatasetConfig-Anfrage aufzurufen:curl -X DELETE \ "https://storageinsights.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/datasetConfigs/DATASET_CONFIG_ID" \ --header "Authorization: Bearer ACCESS_TOKEN" \ --header "Accept: application/json" \ --header "Content-Type: application/json" \
Ersetzen Sie:
PROJECT_ID
durch die ID des Projekts ersetzen, zu dem die Dataset-Konfiguration gehört.LOCATION
durch den Speicherort des Datasets und der Datasetkonfiguration. Beispiel:us-central1
DATASET_CONFIG_ID
durch den Namen der Datensatzkonfiguration, die Sie löschen möchten.ACCESS_TOKEN
mit dem Zugriffstoken, das Sie beim Installieren und Initialisieren der Google Cloud CLI generiert haben.