Diese Seite wurde von der Cloud Translation API übersetzt.

Metastore-Tabellen aus Spark erstellen und abfragen

Sie können Apache Spark Iceberg-Tabellen in einem BigQuery-Notebook mit Open-Source-Engines wie Spark abfragen. Diese Tabellen sind reguläre Iceberg-Tabellen mit Metadaten, die im BigLake Metastore gespeichert sind. Die gleiche Tabelle kann sowohl über BigQuery als auch über Spark abgefragt werden.

Hinweise

Iceberg-Tabelle mit Spark in einem BigQuery-Notebook erstellen Das Tabellenschema wird im BigLake-Metastore gespeichert. Sie können die Tabelle beispielsweise mit Dataproc, Dataproc Serverless oder einer gespeicherten Prozedur erstellen.

Hinweise

Es werden nur Eisbergtabellen unterstützt.
Denken Sie beim Ausführen Ihrer Abfragen daran, Ihre Namespace- und Datenbanknamen als BigQuery-Datasetnamen zuzuordnen. In der folgenden Tabelle sind die entsprechenden Tastenzuordnungen aufgeführt:

Open Source BigQuery

Namespace BigQuery-Dataset

Datenbank BigQuery-Dataset

Tabelle (partitioniert oder nicht partitioniert) BigQuery-Tabelle

Open Source	BigQuery
Namespace	BigQuery-Dataset
Datenbank	BigQuery-Dataset
Tabelle (partitioniert oder nicht partitioniert)	BigQuery-Tabelle

Tabelle aufrufen und abfragen

Nachdem Sie Ihre BigQuery-Ressourcen in Spark erstellt haben, können Sie sie in derGoogle Cloud -Konsole aufrufen und abfragen. Im folgenden Beispiel werden die allgemeinen Schritte zum Abfragen einer Metastore-Tabelle mithilfe von interaktivem Spark veranschaulicht:

Benutzerdefinierten Iceberg-Katalog verwenden:
```
USE `CATALOG_NAME`;
```
Ersetzen Sie Folgendes:
- CATALOG_NAME: der Name des Spark-Katalogs, den Sie für Ihren SQL-Job verwenden.
Erstellen Sie einen Namespace:
```
CREATE NAMESPACE IF NOT EXISTS NAMESPACE_NAME;
```
Ersetzen Sie Folgendes:
- NAMESPACE_NAME: Der Name des Namespace, der auf Ihre Spark-Tabelle verweist.
Verwenden Sie den erstellten Namespace:
```
USE NAMESPACE_NAME;
```
So erstellen Sie eine Iceberg-Tabelle:
```
CREATE TABLE TABLE_NAME (id int, data string) USING ICEBERG;
```
Ersetzen Sie Folgendes:
- TABLE_NAME: Ein Name für die Iceberg-Tabelle.

So fügen Sie eine Tabellenzeile ein:

INSERT INTO TABLE_NAME VALUES (1, "first row");

In der Google Cloud Console haben Sie folgende Möglichkeiten:
- Tabellenmetadaten ansehen
- Tabelle abfragen
```
 SELECT * FROM `TABLE_NAME`;
```

Nächste Schritte

Zusätzliche BigLake Metastore-Funktionen einrichten