Para escribir datos de Dataflow en Apache Iceberg, usa el conector de E/S gestionado.
La E/gestionada admite las siguientes funciones de Apache Iceberg:
Catálogos |
|
---|---|
Funciones de lectura | Lectura por lotes |
Funciones de escritura |
|
En el caso de las tablas de BigQuery para Apache Iceberg,
usa el
conector BigQueryIO
con la API Storage de BigQuery. La tabla ya debe existir. No se admite la creación de tablas dinámicas.
Dependencias
Añade las siguientes dependencias a tu proyecto:
Java
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-managed</artifactId>
<version>${beam.version}</version>
</dependency>
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-io-iceberg</artifactId>
<version>${beam.version}</version>
</dependency>
Destinos dinámicos
La E/gestionada de Apache Iceberg admite destinos dinámicos. En lugar de escribir en una sola tabla fija, el conector puede seleccionar de forma dinámica una tabla de destino en función de los valores de campo de los registros entrantes.
Para usar destinos dinámicos, proporciona una plantilla para el parámetro de configuración table
. Para obtener más información, consulta Destinos dinámicos.
Ejemplos
En los siguientes ejemplos se muestra cómo usar la entrada/salida gestionada para escribir en Apache Iceberg.
Escribir en una tabla de Apache Iceberg
En el siguiente ejemplo se escriben datos JSON en memoria en una tabla de Apache Iceberg.
Java
Para autenticarte en Dataflow, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Escribir con destinos dinámicos
En el siguiente ejemplo se escribe en diferentes tablas de Apache Iceberg en función de un campo de los datos de entrada.
Java
Para autenticarte en Dataflow, configura las credenciales predeterminadas de la aplicación. Para obtener más información, consulta el artículo Configurar la autenticación en un entorno de desarrollo local.
Siguientes pasos
- Leer desde Apache Iceberg
- Escritura de streaming en Apache Iceberg con el catálogo REST de BigLake.
- Consulta más información sobre E/S gestionada.