Pub/Sub Lite mit Dataproc

Pub/Sub Lite ist ein kostengünstiger Echtzeit-Messaging-Dienst, der im Vergleich zu Pub/Sub eine geringere Zuverlässigkeit bietet. Pub/Sub Lite bietet zonale und regionale Themen für die Speicherung.

Pub/Sub Lite Spark-Connector unterstützt Pub/Sub Lite als Eingabequelle für Apache Spark Structured Streaming im standardmäßigen Mikro-Batch-Verarbeitungsmodus und im experimentellen Modus der kontinuierlichen Verarbeitung.

Pub/Sub Lite mit Dataproc verwenden

Java

Das Verzeichnis samples im Repository java-pubsublite-spark auf GitHub enthält ein Spark-Beispiel in Java, das Pub/Sub Lite mit Dataproc verwendet. Folgen Sie der Anleitung im Spark-Beispiel, um das Beispiel auszuführen.

  1. Klonen Sie zuerst das GitHub-Repository java-pubsublite-spark.
    git clone https://github.com/googleapis/java-pubsublite-spark
    cd java-pubsublite-spark/samples
    

Python / Scala

Der Connector ist im Maven Central Repository verfügbar. Sie können den Befehl über die Option --packages herunterladen und bereitstellen, wenn Sie den Befehl spark-submit verwenden oder ihn über das Konfigurationsattribut spark.jars.packages festlegen.

Weitere Informationen

  • In der Kurzanleitung „Pub/Sub Lite mit Apache Spark verwenden“ wird ein Python-Script in einem Dataproc-Cluster ausgeführt, um Daten von und nach Pub/Sub Lite zu lesen und zu schreiben.
  • Wählen Sie hier die Version des Pub/Sub Lite-Spark-Connectors aus und laden Sie dann die JAR-Datei auf die verknüpfte Seite herunter.