Documentación de Dataproc

Dataproc es un servicio Apache Spark y Apache Hadoop gestionado que te permite aprovechar las herramientas de datos de código abierto para el procesamiento por lotes, las consultas, el streaming y el aprendizaje automático. La automatización de Dataproc te ayuda a crear clústeres rápidamente, gestionarlos fácilmente y ahorrar dinero desactivándolos cuando no los necesites. Al dedicar menos tiempo y dinero a la administración, puedes centrarte en tus trabajos y tus datos. Más información

  • Acceder a Gemini 2.0 Flash Thinking
  • Uso mensual gratuito de productos populares, como las APIs de IA y BigQuery
  • Sin cargos automáticos ni permanencia

Sigue explorando con más de 20 productos Always Free

Accede a más de 20 productos gratuitos para casos prácticos habituales, como APIs de IA, máquinas virtuales, almacenes de datos y más.

Descubre formación a tu ritmo, casos prácticos, arquitecturas de referencia y ejemplos de código sobre cómo usar y conectar Google Cloud servicios.
Formación
Formación y tutoriales

Envía tareas de Spark a un clúster de Google Kubernetes Engine en ejecución desde la API Jobs de Dataproc.

Formación
Formación y tutoriales

Este curso combina lecciones, demostraciones y laboratorios prácticos para crear un clúster de Dataproc, enviar una tarea de Spark y, a continuación, cerrar el clúster.

Formación
Formación y tutoriales

Este curso combina clases, demostraciones y laboratorios prácticos para implementar la regresión logística mediante una biblioteca de aprendizaje automático para Apache Spark que se ejecuta en un clúster de Dataproc. El objetivo es desarrollar un modelo para los datos de un conjunto de datos multivariable.

Uso
Casos prácticos

Programa flujos de trabajo en Google Cloud.

Uso
Casos prácticos

Cómo mover datos de un sistema de archivos distribuidos de Hadoop (HDFS) on-premise a Google Cloud.

Uso
Casos prácticos

En este artículo se describen los enfoques recomendados para incluir dependencias al enviar una tarea de Spark a un clúster de Dataproc.

Ejemplo de código
Códigos de ejemplo

Llama a las APIs de Dataproc desde Python.

Ejemplo de código
Códigos de ejemplo

Llama a las APIs de Dataproc desde Java.

Ejemplo de código
Códigos de ejemplo

Llama a las APIs de Dataproc desde Node.js.

Ejemplo de código
Códigos de ejemplo

Llama a las APIs de Dataproc desde Go.

Vídeos relacionados