Documentación de Dataproc

Dataproc es un servicio Apache Spark y Apache Hadoop administrado con el que puedes aprovechar las herramientas de código abierto para procesar, consultar y transmitir datos en lote, además de herramientas de aprendizaje automático. Con la automatización de Dataproc, podrá crear clústeres rápidamente, administrarlos con facilidad y ahorrar dinero desactivándolos cuando no los necesite. Al invertir menos tiempo y dinero en tareas de administración, podrá enfocarse en sus trabajos y datos. Más información

  • Obtén acceso a Gemini 2.0 Flash Thinking
  • Uso mensual gratuito de productos populares, incluidas las APIs de IA y BigQuery
  • Sin cargos automáticos ni compromisos

Sigue explorando con más de 20 productos siempre gratuitos

Accede a más de 20 productos gratuitos para casos de uso comunes, incluidas APIs de IA, VMs, almacenes de datos y mucho más.

Explora la capacitación de autoaprendizaje de Google Cloud Skills Boost, casos de uso, arquitecturas de referencia y muestras de código con ejemplos de cómo usar y conectar los servicios de Google Cloud .
Capacitación
Instructivos y entrenamiento

Enviar trabajos de Spark a un clúster de Google Kubernetes Engine en ejecución desde la API de trabajos de Dataproc.

Capacitación
Instructivos y entrenamiento

Este curso cuenta con una combinación de lecciones, demostraciones y labs prácticos para crear un clúster de Dataproc, enviar un trabajo de Spark y, luego, cerrar el clúster.

Capacitación
Instructivos y entrenamiento

En este curso, se presenta una combinación de lecciones, demostraciones y labs prácticos para implementar la regresión logística mediante una biblioteca de aprendizaje automático para Apache Spark que se ejecuta en un clúster de Dataproc a fin de desarrollar un modelo para los datos de un conjunto de datos multivariable.

Caso de uso
Casos de uso

Programa flujos de trabajo en Google Cloud.

Caso de uso
Casos de uso

Cómo mover datos del sistema de archivos distribuido de Hadoop local (HDFS) a Google Cloud.

Caso de uso
Casos de uso

Enfoques recomendados para incluir dependencias cuando envías un trabajo de Spark a un clúster de Dataproc

Muestra de código
Muestras de código

Llamar a las API de Dataproc desde Python

Muestra de código
Muestras de código

Llamar a las API de Dataproc desde Java

Muestra de código
Muestras de código

Llamar a las API de Dataproc desde Node.js.

Muestra de código
Muestras de código

Llamar a las API de Dataproc desde Go

Videos relacionados