Documentazione di Dataproc
Dataproc è un servizio Apache Spark e Apache Hadoop gestito che ti consente di sfruttare gli strumenti per i dati open source per elaborazione batch, esecuzione di query, streaming e machine learning. L'automazione di Dataproc ti aiuta a creare i cluster rapidamente, a gestirli con facilità e a risparmiare denaro disattivandoli quando non ti servono. Risparmiando tempo e denaro sull'amministrazione, puoi concentrarti sui tuoi progetti e sui tuoi dati. Scopri di più
Inizia la tua proof of concept con 300 $di credito gratuito
- Accedere a Gemini 2.0 Flash Thinking
- Utilizzo mensile gratuito di prodotti popolari, tra cui le API di AI e BigQuery
- Nessun addebito automatico, nessun impegno
Continua a esplorare con oltre 20 prodotti Always Free
Accedi a oltre 20 prodotti gratuiti per casi d'uso comuni, tra cui API AI, VM, data warehouse e altro ancora.
Risorse di documentazione
Guide
Risorse correlate
Esegui un job Spark su Google Kubernetes Engine
Invia job Spark a un cluster Google Kubernetes Engine in esecuzione dall'API Dataproc Jobs.
Introduzione a Cloud Dataproc: Hadoop e Spark su Google Cloud
Questo corso offre una combinazione di lezioni, demo e lab pratici per creare un cluster Dataproc, inviare un job Spark e poi arrestare il cluster.
Machine learning con Spark su Dataproc
Questo corso presenta una combinazione di lezioni, demo e lab pratici per implementare la regressione logistica utilizzando una libreria di machine learning per Apache Spark in esecuzione su un cluster Dataproc per sviluppare un modello per i dati di un set di dati multivariato.
Soluzioni di pianificazione del flusso di lavoro
Pianifica i workflow su Google Cloud.
Migrazione dei dati HDFS da on-premise a Google Cloud
Come spostare i dati da Hadoop Distributed File System (HDFS) on-premise a Google Cloud.
Gestire le dipendenze Java e Scala per Apache Spark
Approcci consigliati per includere le dipendenze quando invii un job Spark a un cluster Dataproc.
Esempi di API Python
Chiama le API Dataproc da Python.
Esempi di API Java
Chiama le API Dataproc da Java.
Esempi di API Node.js
Chiama le API Dataproc da Node.js.
Esempi di API Go
Chiama le API Dataproc da Go.