Dataproc は、オープンソースのデータツールを利用してバッチ処理、クエリ実行、ストリーミング、ML を行えるマネージド Apache Spark / Apache Hadoop サービスです。Dataproc の自動化機能を利用すると、クラスタを速やかに作成し、簡単に管理できます。また、不要なときにはクラスタを無効にして費用を節約できます。管理にかかる時間と費用が削減されるので、自分の仕事とデータに集中できます。詳細
無料で開始
$300 分の無料クレジットを使用して概念実証を始める
-
Gemini 2.0 Flash Thinking をご利用いただけます。
-
AI API や BigQuery などの人気プロダクトの毎月の無料使用枠をご利用いただけます。
-
自動請求は行われず、契約も不要です。
無料のプロダクト オファーを見る
常に無料で利用可能な 20 以上のプロダクトを確認する
AI API、VM、データ ウェアハウスなど、一般的なユースケース向けの 20 以上のプロダクトを無料でご利用いただけます。
トレーニング
トレーニングとチュートリアル
Google Kubernetes Engine で Spark ジョブを実行する
Dataproc Jobs API から稼働中の Google Kubernetes Engine クラスタに Spark ジョブを送信します。
トレーニング
トレーニングとチュートリアル
Introduction to Cloud Dataproc: Hadoop and Spark on Google Cloud
このコースでは、講義、デモ、ハンズオンラボを組み合わせて、Dataproc クラスタの作成、Spark ジョブの送信、クラスタのシャットダウンを行います。
トレーニング
トレーニングとチュートリアル
Dataproc で Spark を使用した ML
このコースでは、講義、デモ、ハンズオンラボを組み合わせて、Dataproc クラスタで実行する Apache Spark の ML ライブラリを使用してロジスティック回帰を実装し、多変数データセットのデータ用のモデルを作成します。
ユースケース
ユースケース
ワークフロー スケジューリング ソリューション
Google Cloud でワークフローをスケジュールします。
ユースケース
ユースケース
オンプレミスから Google Cloud への HDFS データの移行
オンプレミスの Hadoop 分散ファイル システム(HDFS)から Google Cloud にデータを移動する方法。
ユースケース
ユースケース
Apache Spark に関する Java と Scala の依存関係の管理
Dataproc クラスタに Spark ジョブを送信する際に依存関係を含めるうえで推奨される方法を紹介します。
コードサンプル
コードサンプル
Python API のサンプル
Python から Dataproc API を呼び出します。
コードサンプル
コードサンプル
Java API のサンプル
Java から Dataproc API を呼び出します。
コードサンプル
コードサンプル
Node.js API のサンプル
Node.js から Dataproc API を呼び出します。
コードサンプル
コードサンプル
Go API のサンプル
Go から Dataproc API を呼び出します。
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2025-06-19 UTC。
[[["わかりやすい","easyToUnderstand","thumb-up"],["問題の解決に役立った","solvedMyProblem","thumb-up"],["その他","otherUp","thumb-up"]],[["わかりにくい","hardToUnderstand","thumb-down"],["情報またはサンプルコードが不正確","incorrectInformationOrSampleCode","thumb-down"],["必要な情報 / サンプルがない","missingTheInformationSamplesINeed","thumb-down"],["翻訳に関する問題","translationIssue","thumb-down"],["その他","otherDown","thumb-down"]],["最終更新日 2025-06-19 UTC。"],[[["Dataproc is a managed service for Apache Spark and Apache Hadoop, enabling batch processing, querying, streaming, and machine learning with open-source data tools."],["Dataproc automates cluster creation and management, helping users save time and money by allowing clusters to be turned off when not in use."],["Documentation provides resources such as quickstarts, guides, references, and help for common issues."],["Dataproc can be used on a variety of use cases such as workflow scheduling solutions, migrating data from on-premise, and dependency management."],["The documentation provides examples on how to call the Dataproc API in Python, Java, Node.js, and Go."]]],[]]