Daten mit der Google Cloud -Konsole laden und abfragen

Google Cloud Informationen zum Erstellen eines Datasets, zum Laden von Beispieldaten in eine BigQuery-Tabelle und zum Abfragen von Tabellen


Eine detaillierte Anleitung dazu finden Sie direkt in der Google Cloud Console. Klicken Sie dazu einfach auf Anleitung:

Anleitung


Hinweise

Bevor Sie sich BigQuery genauer ansehen können, müssen Sie sich in derGoogle Cloud Console anmelden und ein Projekt erstellen. Wenn Sie die Abrechnung in Ihrem Projekt nicht aktivieren, befinden sich alle hochgeladenen Daten in der BigQuery-Sandbox. Mithilfe der Sandbox können Sie sich kostenlos mit BigQuery vertraut machen, während Sie mit einer begrenzten Anzahl von BigQuery-Features arbeiten. Weitere Informationen finden Sie unter BigQuery-Sandbox aktivieren.

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  4. Optional: Wenn Sie ein vorhandenes Projekt auswählen, müssen Sie die BigQuery API aktivieren. Die BigQuery-API wird in neuen Projekten automatisch aktiviert.

BigQuery-Dataset erstellen

Erstellen Sie mit der Google Cloud Console ein Dataset, in dem die Daten gespeichert werden.

  1. Öffnen Sie in der Google Cloud Console die Seite „BigQuery“.
  2. BigQuery aufrufen
  3. Klicken Sie im Bereich Explorer auf den Namen Ihres Projekts.
  4. Klicken Sie auf  Aktionen ansehen.
  5. Wählen Sie Dataset erstellen aus.
  6. Führen Sie auf der Seite Dataset erstellen die folgenden Schritte aus:
    1. Geben Sie unter Dataset-ID babynames ein.
    2. Wählen Sie als Standorttyp die Option Mehrere Regionen und dann USA (mehrere Regionen in den USA) aus. Die öffentlichen Datasets sind am multiregionalen Standort us gespeichert. Der Einfachheit halber sollten Sie Ihr Dataset am selben Standort speichern.
    3. Übernehmen Sie die verbleibenden Standardeinstellungen und klicken Sie auf Dataset erstellen.

Quelldaten-Datei herunterladen

Die heruntergeladene Datei enthält ca. 7 MB an Daten zu beliebten Babynamen. Sie wird von der US-amerikanischen Sozialversicherungsbehörde bereitgestellt.

Weitere Informationen zum Dataset finden Sie auf der Seite der Sozialversicherungsbehörde mit Dataset-Informationen.

  1. Laden Sie das Dataset der US-amerikanischen Sozialversicherungsbehörde herunter. Öffnen Sie dazu folgende URL in einem neuen Browsertab:

    https://www.ssa.gov/OACT/babynames/names.zip
    
  2. Extrahieren Sie die Datei:

    Weitere Informationen zum Dataset-Schema finden Sie in der Datei NationalReadMe.pdf in der ZIP-Datei.

  3. Um sich die Daten anzusehen, öffnen Sie die Datei yob2014.txt. Diese Datei enthält kommagetrennte Werte für den Namen, das bei der Geburt zugewiesene Geschlecht und die Anzahl der Kinder mit diesem Namen. Die Datei hat keine Kopfzeile.

  4. Notieren Sie sich den Speicherort der Datei yob2014.txt, damit Sie sie später wiederfinden.

Daten in eine Tabelle laden

Als Nächstes laden Sie die Daten in eine neue Tabelle.

  1. Klicken Sie im Bereich Explorer auf den Namen Ihres Projekts.
  2. Klicken Sie neben dem Dataset babynames auf Aktionen ansehen und wählen Sie Öffnen aus.
  3. Klicken Sie auf Tabelle erstellen.

    Sofern nicht anders angegeben, verwenden Sie für alle Einstellungen die Standardwerte.

  4. Führen Sie auf der Seite Tabelle erstellen die folgenden Schritte aus:
    1. Wählen Sie im Abschnitt Quelle die Option Hochladen aus der Liste Tabelle erstellen aus aus.
    2. Klicken Sie im Feld Datei auswählen auf Durchsuchen.
    3. Öffnen Sie Ihre lokale Datei yob2014.txt und klicken Sie auf Öffnen.
    4. Wählen Sie in der Liste Dateiformat die Option CSV aus.
    5. Geben Sie im Abschnitt Ziel im Feld Tabelle den Wert names_2014 ein.
    6. Klicken Sie im Abschnitt Schema auf die Ein/Aus-Schaltfläche Als Text bearbeiten und fügen Sie die folgende Schemadefinition in das Textfeld ein:
    7. name:string,assigned_sex_at_birth:string,count:integer
    8. Klicken Sie auf Tabelle erstellen.

      Warten Sie, bis BigQuery die Tabelle erstellt und die Daten geladen hat. Wenn BigQuery das Laden der Daten abgeschlossen hat, maximieren Sie die Bereiche Persönlicher Verlauf und Projektverlauf, um sich die Jobdetails anzusehen.

Vorschau von Tabellendaten

So lassen Sie die Tabellendaten in der Vorschau anzeigen:

  1. Maximieren Sie im Bereich Explorer Ihr Projekt und das Dataset babynames und wählen Sie die Tabelle names_2014 aus.
  2. Klicken Sie auf den Tab Vorschau. BigQuery zeigt die ersten Zeilen der Tabelle an.
  3. Tabellenvorschau
Die Vorschau ist nicht für alle Tabellentypen verfügbar. Beispielsweise wird der Tab Vorschau nicht für externe Tabellen oder Ansichten angezeigt.

Tabellendaten abfragen

Fragen Sie als Nächstes die Tabelle ab. Die Vorgehensweise ist mit dem vorangegangenen Beispiel identisch, nur dass Sie jetzt anstelle einer öffentlichen Tabelle Ihre eigene Tabelle abfragen.

  1. Klicken Sie im Detailbereich auf SQL-Abfrage. Ein neuer Editor-Tab wird geöffnet.
  2. Fügen Sie die folgende Abfrage in den Abfrageeditor ein. Diese Abfrage ruft die fünf beliebtesten Namen für Babys in den USA ab, denen bei der Geburt in 2014 das männliche Geschlecht zugewiesen wurde.
    
        SELECT
          name,
          count
        FROM
          `babynames.names_2014`
        WHERE
          assigned_sex_at_birth = 'M'
        ORDER BY
          count DESC
        LIMIT
          5;
        
  3. Klicken Sie auf Ausführen. Die Ergebnisse werden im Abschnitt Abfrageergebnisse angezeigt.
    Ergebnisse der Namensabfrage

Sie haben erfolgreich eine Tabelle in einem öffentlichen Dataset abgefragt und dann Ihre Beispieldaten mit der Google Cloud Console in BigQuery geladen.

Bereinigen

Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud -Konto die in dieser Anleitung verwendeten Ressourcen in Rechnung gestellt werden:

  1. Öffnen Sie in der Google Cloud Console die Seite „BigQuery“.
  2. BigQuery aufrufen
  3. Klicken Sie im Bereich Explorer auf das von Ihnen erstellte Dataset babynames.
  4. Maximieren Sie die Option Aktionen ansehen und klicken Sie auf Löschen.
  5. Bestätigen Sie im Dialogfeld Dataset löschen den Löschbefehl: Geben Sie dafür das Wort delete ein und klicken Sie auf Löschen.

Nächste Schritte