Package google.cloud.dataproc.v1

インデックス

BatchController

BatchController には、バッチ ワークロードを管理するメソッドが用意されています。

CreateBatch

rpc CreateBatch(CreateBatchRequest) returns (Operation)

非同期で実行されるバッチ ワークロードを作成します。

認可スコープ

次の OAuth スコープが必要です。

  • https://www.googleapis.com/auth/cloud-platform

詳細については、認証の概要をご覧ください。

DeleteBatch

rpc DeleteBatch(DeleteBatchRequest) returns (Empty)

バッチ ワークロード リソースを削除します。バッチが CANCELLEDSUCCEEDED、または FAILED State にない場合、削除オペレーションは失敗し、レスポンスで FAILED_PRECONDITION が返されます。

認可スコープ

次の OAuth スコープが必要です。

  • https://www.googleapis.com/auth/cloud-platform

詳細については、認証の概要をご覧ください。

GetBatch

rpc GetBatch(GetBatchRequest) returns (Batch)

バッチ ワークロード リソースの表現を取得します。

認可スコープ

次の OAuth スコープが必要です。

  • https://www.googleapis.com/auth/cloud-platform

詳細については、認証の概要をご覧ください。

ListBatches

rpc ListBatches(ListBatchesRequest) returns (ListBatchesResponse)

バッチ ワークロードを一覧表示します。

認可スコープ

次の OAuth スコープが必要です。

  • https://www.googleapis.com/auth/cloud-platform

詳細については、認証の概要をご覧ください。

SessionController

SessionController には、インタラクティブ セッションを管理するメソッドが用意されています。

CreateSession

rpc CreateSession(CreateSessionRequest) returns (Operation)

インタラクティブ セッションを非同期で作成します。

認可スコープ

次の OAuth スコープが必要です。

  • https://www.googleapis.com/auth/cloud-platform

詳細については、認証の概要をご覧ください。

DeleteSession

rpc DeleteSession(DeleteSessionRequest) returns (Operation)

インタラクティブ セッション リソースを削除します。セッションがターミナル状態でない場合は、終了してから削除されます。

認可スコープ

次の OAuth スコープが必要です。

  • https://www.googleapis.com/auth/cloud-platform

詳細については、認証の概要をご覧ください。

GetSession

rpc GetSession(GetSessionRequest) returns (Session)

インタラクティブ セッションのリソース表現を取得します。

認可スコープ

次の OAuth スコープが必要です。

  • https://www.googleapis.com/auth/cloud-platform

詳細については、認証の概要をご覧ください。

ListSessions

rpc ListSessions(ListSessionsRequest) returns (ListSessionsResponse)

インタラクティブ セッションを一覧表示します。

認可スコープ

次の OAuth スコープが必要です。

  • https://www.googleapis.com/auth/cloud-platform

詳細については、認証の概要をご覧ください。

TerminateSession

rpc TerminateSession(TerminateSessionRequest) returns (Operation)

インタラクティブ セッションを終了します。

認可スコープ

次の OAuth スコープが必要です。

  • https://www.googleapis.com/auth/cloud-platform

詳細については、認証の概要をご覧ください。

SessionTemplateController

SessionTemplateController には、セッション テンプレートを管理するメソッドが用意されています。

CreateSessionTemplate

rpc CreateSessionTemplate(CreateSessionTemplateRequest) returns (SessionTemplate)

セッション テンプレートを同期的に作成します。

認可スコープ

次の OAuth スコープが必要です。

  • https://www.googleapis.com/auth/cloud-platform

詳細については、認証の概要をご覧ください。

DeleteSessionTemplate

rpc DeleteSessionTemplate(DeleteSessionTemplateRequest) returns (Empty)

セッション テンプレートを削除します。

認可スコープ

次の OAuth スコープが必要です。

  • https://www.googleapis.com/auth/cloud-platform

詳細については、認証の概要をご覧ください。

GetSessionTemplate

rpc GetSessionTemplate(GetSessionTemplateRequest) returns (SessionTemplate)

セッション テンプレートのリソース表現を取得します。

認可スコープ

次の OAuth スコープが必要です。

  • https://www.googleapis.com/auth/cloud-platform

詳細については、認証の概要をご覧ください。

ListSessionTemplates

rpc ListSessionTemplates(ListSessionTemplatesRequest) returns (ListSessionTemplatesResponse)

セッション テンプレートを一覧表示します。

認可スコープ

次の OAuth スコープが必要です。

  • https://www.googleapis.com/auth/cloud-platform

詳細については、認証の概要をご覧ください。

UpdateSessionTemplate

rpc UpdateSessionTemplate(UpdateSessionTemplateRequest) returns (SessionTemplate)

セッション テンプレートを同期的に更新します。

認可スコープ

次の OAuth スコープが必要です。

  • https://www.googleapis.com/auth/cloud-platform

詳細については、認証の概要をご覧ください。

AnalyzeOperationMetadata

Analyze オペレーションを記述するメタデータ。

フィールド
analyzed_workload_name

string

出力専用。分析対象のワークロードの名前。

analyzed_workload_type

WorkloadType

出力専用。分析対象のワークロードのタイプ。

analyzed_workload_uuid

string

出力専用。通常はコントロール プレーンによって生成されるワークロードの一意の識別子。例: バッチ UUID。

create_time

Timestamp

出力専用。オペレーションが作成された時刻。

done_time

Timestamp

出力専用。オペレーションが完了した時刻。

description

string

出力専用。オペレーションの簡単な説明。

labels

map<string, string>

出力専用。オペレーションに関連付けられているラベル。

warnings[]

string

出力専用。オペレーションの実行中に発生した警告。

WorkloadType

ワークロード タイプ

列挙型
WORKLOAD_TYPE_UNSPECIFIED 未定義のオプション
BATCH サーバーレス バッチジョブ

AutotuningConfig

ワークロードの自動チューニング構成。

フィールド
scenarios[]

Scenario

省略可。チューニングが適用されるシナリオ。

シナリオ

シナリオは、自動チューニングがワークロードの変更によって達成しようとする特定の目標を表します。

列挙型
SCENARIO_UNSPECIFIED デフォルト値。
SCALING initialExecutors などのスケーリングの推奨事項。
BROADCAST_HASH_JOIN 潜在的な関係ブロードキャストに関するヒントを追加しました。
MEMORY ワークロードのメモリ管理。

バッチ

サービス内のバッチ ワークロードを表します。

フィールド
name

string

出力専用。バッチのリソース名。

uuid

string

出力専用。バッチ UUID(一意のユニバーサル識別子)。この値は、サービスがバッチを作成するときに生成されます。

create_time

Timestamp

出力専用。バッチが作成された時刻。

runtime_info

RuntimeInfo

出力専用。バッチ実行に関するランタイム情報。

state

State

出力専用。バッチの状態。

state_message

string

出力専用。バッチの状態の詳細(状態が FAILED の場合のエラーの説明など)。

state_time

Timestamp

出力専用。バッチが現在の状態になった時刻。

creator

string

出力専用。バッチを作成したユーザーのメールアドレス。

labels

map<string, string>

省略可。このバッチに関連付けるラベル。ラベルのキーは 1 ~ 63 文字で、RFC 1035 に準拠している必要があります。ラベルのは空にできますが、指定する場合は 1 ~ 63 文字で、RFC 1035 に準拠している必要があります。1 つのバッチに関連付けることができるラベルは 32 個までです。

runtime_config

RuntimeConfig

省略可。バッチ実行のランタイム構成。

environment_config

EnvironmentConfig

省略可。バッチ実行の環境構成。

operation

string

出力専用。このバッチに関連付けられたオペレーションのリソース名。

state_history[]

StateHistory

出力専用。バッチの過去の状態情報。

共用体フィールド batch_config。バッチ構成のアプリケーション/フレームワーク固有の部分。batch_config は次のいずれかになります。
pyspark_batch

PySparkBatch

省略可。PySpark バッチ構成。

spark_batch

SparkBatch

省略可。Spark バッチ構成。

spark_r_batch

SparkRBatch

省略可。SparkR バッチ構成。

spark_sql_batch

SparkSqlBatch

省略可。SparkSql バッチ構成。

バッチの状態。

列挙型
STATE_UNSPECIFIED バッチの状態は不明です。
PENDING バッチは実行前に作成されます。
RUNNING バッチが実行中です。
CANCELLING バッチがキャンセルされています。
CANCELLED 一括解約が正常に完了しました。
SUCCEEDED バッチが正常に完了しました。
FAILED エラーが発生したため、バッチの実行が停止しました。

StateHistory

過去の状態情報。

フィールド
state

State

出力専用。履歴のこの時点でのバッチの状態。

state_message

string

出力専用。この時点の状態に関する詳細。

state_start_time

Timestamp

出力専用。バッチが履歴状態になった時刻。

BatchOperationMetadata

バッチ オペレーションを記述するメタデータ。

フィールド
batch

string

オペレーションのバッチ名。

batch_uuid

string

オペレーションのバッチ UUID。

create_time

Timestamp

オペレーションが作成された時刻。

done_time

Timestamp

オペレーションが完了した時刻。

operation_type

BatchOperationType

オペレーションのタイプ。

description

string

オペレーションの簡単な説明。

labels

map<string, string>

オペレーションに関連付けられているラベル。

warnings[]

string

オペレーションの実行中に発生した警告。

BatchOperationType

Batch リソースのオペレーション タイプ

列挙型
BATCH_OPERATION_TYPE_UNSPECIFIED バッチ オペレーションのタイプが不明です。
BATCH バッチ オペレーションのタイプ。

CreateBatchRequest

バッチ ワークロードを作成するためのリクエスト。

フィールド
parent

string

必須。このバッチが作成される親リソース。

認可には、指定されたリソース parent に対する次の IAM の権限が必要です。

  • dataproc.batches.create
batch

Batch

必須。作成するバッチ。

batch_id

string

省略可。バッチに使用する ID。バッチのリソース名の最終的なコンポーネントになります。

この値は 4 ~ 63 文字にする必要があります。有効な文字は /[a-z][0-9]-/ です。

request_id

string

省略可。リクエストの識別に使用される一意の ID。サービスが同じ request_id を持つ 2 つの CreateBatchRequest を受信した場合、2 番目のリクエストは無視され、バックエンドで作成されて保存された最初のバッチに対応するオペレーションが返されます。

推奨: この値は UUID に設定します。

値に使用できるのは、英字(a ~ z、A ~ Z)、数字(0 ~ 9)、アンダースコア(_)、ハイフン(-)のみです。最大長は 40 文字です。

CreateSessionRequest

セッションの作成リクエスト。

フィールド
parent

string

必須。このセッションが作成される親リソース。

認可には、指定されたリソース parent に対する次の IAM の権限が必要です。

  • dataproc.sessions.create
session

Session

必須。作成するインタラクティブ セッション。

session_id

string

必須。セッションに使用する ID。セッションのリソース名の最終的なコンポーネントになります。

この値は 4 ~ 63 文字にする必要があります。有効な文字は /[a-z][0-9]-/ です。

request_id

string

省略可。リクエストの識別に使用される一意の ID。サービスが同じ ID の 2 つの CreateSessionRequest を受信した場合、2 番目のリクエストは無視され、最初の Session が作成されてバックエンドに保存されます。

推奨: この値は UUID に設定します。

値に使用できるのは、英字(a ~ z、A ~ Z)、数字(0 ~ 9)、アンダースコア(_)、ハイフン(-)のみです。最大長は 40 文字です。

CreateSessionTemplateRequest

セッション テンプレートを作成するためのリクエスト。

フィールド
parent

string

必須。このセッション テンプレートが作成される親リソース。

認可には、指定されたリソース parent に対する次の IAM の権限が必要です。

  • dataproc.sessionTemplates.create
session_template

SessionTemplate

必須。作成するセッション テンプレート。

DeleteBatchRequest

バッチ ワークロードを削除するリクエスト。

フィールド
name

string

必須。取得するバッチの完全修飾名(形式は「projects/PROJECT_ID/locations/DATAPROC_REGION/batches/BATCH_ID」)。

認可には、指定されたリソース name に対する次の IAM の権限が必要です。

  • dataproc.batches.delete

DeleteSessionRequest

セッションを削除するリクエスト。

フィールド
name

string

必須。削除するセッション リソースの名前。

認可には、指定されたリソース name に対する次の IAM の権限が必要です。

  • dataproc.sessions.delete
request_id

string

省略可。リクエストの識別に使用される一意の ID。サービスが同じ ID の 2 つの DeleteSessionRequest を受信した場合、2 回目のリクエストは無視されます。

推奨: この値は UUID に設定します。

値に使用できるのは、英字(a ~ z、A ~ Z)、数字(0 ~ 9)、アンダースコア(_)、ハイフン(-)のみです。最大長は 40 文字です。

DeleteSessionTemplateRequest

セッション テンプレートを削除するリクエスト。

フィールド
name

string

必須。削除するセッション テンプレート リソースの名前。

認可には、指定されたリソース name に対する次の IAM の権限が必要です。

  • dataproc.sessionTemplates.delete

DiagnoseClusterResults

診断出力の場所。

フィールド
output_uri

string

出力専用。診断出力の Cloud Storage URI。出力レポートは、収集された診断の概要を含むプレーン テキスト ファイルです。

EnvironmentConfig

ワークロードの環境構成。

フィールド
execution_config

ExecutionConfig

省略可。ワークロードの実行構成。

peripherals_config

PeripheralsConfig

省略可。ワークロードがアクセスできる周辺機器の構成。

ExecutionConfig

ワークロードの実行構成。

フィールド
service_account

string

省略可。ワークロードの実行に使用されたサービス アカウント。

network_tags[]

string

省略可。ネットワーク トラフィック制御に使用されるタグ。

kms_key

string

省略可。暗号化に使用する Cloud KMS 鍵。

idle_ttl

Duration

省略可。セッションにのみ適用されます。アイドル状態のときにセッションを維持する時間。このしきい値を超えると、セッションが終了します。このフィールドは、バッチ ワークロードに設定できません。最小値は 10 分で、最大値は 14 日です(Duration の JSON 表現を参照)。設定しない場合、デフォルトは 1 時間です。インタラクティブ セッションに ttlidle_ttl の両方が指定されている場合、これらの条件は OR 条件として扱われます。ワークロードは、idle_ttl 時間アイドル状態になったとき、または ttl を超えたときに、どちらか早い方で終了します。

ttl

Duration

省略可。ワークロードが終了するまでの時間。[期間] の JSON 表現として指定します。ワークロードがこの期間を超えると、進行中の作業の終了を待たずに無条件に終了します。バッチ ワークロードに ttl が指定されていない場合、ワークロードは自然に終了するまで実行されます(終了しない場合、永続的に実行されます)。インタラクティブ セッションに ttl が指定されていない場合、デフォルトは 24 時間です。2.1 以降のランタイム バージョンを使用するバッチに ttl が指定されていない場合、デフォルトは 4 時間です。最小値は 10 分で、最大値は 14 日です。ttlidle_ttl の両方が指定されている場合(インタラクティブ セッションの場合)、条件は OR 条件として扱われます。ワークロードは、idle_ttl 時間アイドル状態になったとき、または ttl を超えたときに、どちらか早い方で終了します。

staging_bucket

string

省略可。ワークロードの依存関係と構成ファイルをステージングし、ワークロードの出力や、Spark 履歴ファイルなどのエフェメラル データを保存するために使用される Cloud Storage バケット。ステージング バケットを指定しない場合、Cloud Dataproc はワークロードが実行されているリージョンに応じて Cloud Storage のロケーションを決定し、プロジェクト レベルのロケーションごとのステージング バケットと一時バケットを作成して管理します。このフィールドには、Cloud Storage バケットへの gs://... URI ではなく、Cloud Storage バケット名が必要です。

共用体フィールド network。ワークロード実行のネットワーク構成。network は次のいずれかになります。
network_uri

string

省略可。ワークロードを接続するネットワーク URI。

subnetwork_uri

string

省略可。ワークロードを接続するサブネットワークの URI。

GetBatchRequest

バッチ ワークロードのリソース表現を取得するリクエスト。

フィールド
name

string

必須。取得するバッチの完全修飾名(形式は「projects/PROJECT_ID/locations/DATAPROC_REGION/batches/BATCH_ID」)。

認可には、指定されたリソース name に対する次の IAM の権限が必要です。

  • dataproc.batches.get

GetSessionRequest

セッションのリソース表現を取得するためのリクエスト。

フィールド
name

string

必須。取得するセッションの名前。

認可には、指定されたリソース name に対する次の IAM の権限が必要です。

  • dataproc.sessions.get

GetSessionTemplateRequest

セッション テンプレートのリソース表現を取得するためのリクエスト。

フィールド
name

string

必須。取得するセッション テンプレートの名前。

認可には、指定されたリソース name に対する次の IAM の権限が必要です。

  • dataproc.sessionTemplates.get

JupyterConfig

インタラクティブ セッションの Jupyter 構成。

フィールド
kernel

Kernel

省略可。カーネル

display_name

string

省略可。表示名。Jupyter の kernelspec カードに表示されます。

カーネル

Jupyter カーネルタイプ。

列挙型
KERNEL_UNSPECIFIED カーネルは不明です。
PYTHON Python カーネル。
SCALA Scala カーネル。

ListBatchesRequest

プロジェクト内のバッチ ワークロードを一覧表示するリクエスト。

フィールド
parent

string

必須。このバッチのコレクションを所有する親。

認可には、指定されたリソース parent に対する次の IAM の権限が必要です。

  • dataproc.batches.list
page_size

int32

省略可。各レスポンスで返されるバッチの最大数。サービスが返す値はこれよりも少ないことがあります。デフォルトのページサイズは 20 で、最大ページサイズは 1,000 です。

page_token

string

省略可。前回の ListBatches 呼び出しから受け取ったページトークン。後続のページを取得するには、このトークンを指定します。

filter

string

省略可。レスポンスで返されるバッチのフィルタ。

フィルタは、各バッチリソースのさまざまなフィールドの値を制約する論理式です。フィルタは、大文字と小文字が区別され、論理演算子(AND/OR)で組み合わせた複数の句を含めることができます。サポートされているフィールドは batch_idbatch_uuidstatecreate_timelabels です。

たとえば、state = RUNNING and create_time < "2023-01-01T00:00:00Z" は、2023 年 1 月 1 日より前に作成された RUNNING 状態のバッチをフィルタします。state = RUNNING and labels.environment=production は、本番環境ラベルを持つ RUNNING 状態のバッチをフィルタします。

フィルタ構文の詳細とサポートされている比較の一覧については、https://google.aip.dev/assets/misc/ebnf-filtering.txt をご覧ください。

order_by

string

省略可。バッチのリストを並べ替えるフィールド。

現在、サポートされている並べ替え順序は、指定なし(空)と、最近作成されたバッチを優先して並べ替える create_time desc のみです。

詳しくは、https://google.aip.dev/132#ordering をご覧ください。

ListBatchesResponse

バッチ ワークロードのリスト。

フィールド
batches[]

Batch

出力専用。指定されたコレクションのバッチ。

next_page_token

string

次のページを取得するために page_token として送信できるトークン。このフィールドを省略すると、後続のページはなくなります。

unreachable[]

string

出力専用。レスポンスに含められなかったバッチのリスト。これらのリソースのいずれかを取得しようとすると、リスト レスポンスに含まれなかった理由が示される場合があります。

ListSessionTemplatesRequest

プロジェクト内のセッション テンプレートを一覧表示するリクエスト。

フィールド
parent

string

必須。このセッション テンプレートのコレクションを所有する親。

認可には、指定されたリソース parent に対する次の IAM の権限が必要です。

  • dataproc.sessionTemplates.list
page_size

int32

省略可。各レスポンスで返されるセッションの最大数。サービスが返す値はこれよりも少ないことがあります。

page_token

string

省略可。前回の ListSessions 呼び出しから受け取ったページトークン。後続のページを取得するには、このトークンを指定します。

filter

string

省略可。レスポンスで返されるセッション テンプレートのフィルタ。フィルタでは大文字と小文字が区別され、構文は次のとおりです。

[フィールド = 値] AND [フィールド [= 値]] ...

ListSessionTemplatesResponse

セッション テンプレートのリスト。

フィールド
session_templates[]

SessionTemplate

出力専用。セッション テンプレートのリスト

next_page_token

string

次のページを取得するために page_token として送信できるトークン。このフィールドを省略すると、後続のページはなくなります。

ListSessionsRequest

プロジェクト内のセッションを一覧表示するリクエスト。

フィールド
parent

string

必須。このセッション コレクションを所有する親。

認可には、指定されたリソース parent に対する次の IAM の権限が必要です。

  • dataproc.sessions.list
page_size

int32

省略可。各レスポンスで返されるセッションの最大数。サービスが返す値はこれよりも少ないことがあります。

page_token

string

省略可。前回の ListSessions 呼び出しから受け取ったページトークン。後続のページを取得するには、このトークンを指定します。

filter

string

省略可。レスポンスで返されるセッションのフィルタ。

フィルタは、各セッション リソースのさまざまなフィールドの値を制約する論理式です。フィルタは、大文字と小文字が区別され、論理演算子(AND、OR)で組み合わせた複数の句を含めることができます。サポートされているフィールドは session_idsession_uuidstatecreate_timelabels です。

例: state = ACTIVE and create_time < "2023-01-01T00:00:00Z" は、2023 年 1 月 1 日より前に作成された ACTIVE 状態のセッションのフィルタです。state = ACTIVE and labels.environment=production は、本番環境ラベルを持つ ACTIVE 状態のセッションのフィルタです。

フィルタ構文の詳細とサポートされている比較演算子のリストについては、https://google.aip.dev/assets/misc/ebnf-filtering.txt をご覧ください。

ListSessionsResponse

インタラクティブ セッションのリスト。

フィールド
sessions[]

Session

出力専用。指定したコレクションのセッション。

next_page_token

string

次のページを取得するために page_token として送信できるトークン。このフィールドを省略すると、後続のページはなくなります。

PeripheralsConfig

ワークロードの補助サービスの構成。

フィールド
metastore_service

string

省略可。既存の Dataproc Metastore サービスのリソース名。

例:

  • projects/[project_id]/locations/[region]/services/[service_id]
spark_history_server_config

SparkHistoryServerConfig

省略可。ワークロードの Spark History Server 構成。

PyPiRepositoryConfig

PyPi リポジトリの構成

フィールド
pypi_repository

string

省略可。PyPi リポジトリのアドレス

PySparkBatch

Apache PySpark バッチ ワークロードを実行するための構成。

フィールド
main_python_file_uri

string

必須。Spark ドライバとして使用するメインの Python ファイルの HCFS URI。.py ファイルを指定する必要があります。

args[]

string

省略可。ドライバに渡す引数。--conf など、バッチ プロパティとして設定できる引数は含めないでください。競合が発生して、バッチが正しく送信されない可能性があります。

python_file_uris[]

string

省略可。PySpark フレームワークに渡す Python ファイルの HCFS ファイル URI。サポートされているファイル形式: .py.egg.zip

jar_file_uris[]

string

省略可。Spark ドライバとタスクのクラスパスに追加する JAR ファイルの HCFS URI。

file_uris[]

string

省略可。各エグゼキュータの作業ディレクトリに配置されるファイルの HCFS URI。

archive_uris[]

string

省略可。各エグゼキュータの作業ディレクトリに解凍されるアーカイブの HCFS URI。サポートされているファイル形式: .jar.tar.tar.gz.tgz.zip

RepositoryConfig

依存関係リポジトリの構成

フィールド
pypi_repository_config

PyPiRepositoryConfig

省略可。PyPi リポジトリの構成。

RuntimeConfig

ワークロードのランタイム構成。

フィールド
version

string

省略可。バッチ ランタイムのバージョン。

container_image

string

省略可。ジョブ ランタイム環境用のカスタム コンテナ イメージ(省略可)。指定しない場合は、デフォルトのコンテナ イメージが使用されます。

properties

map<string, string>

省略可。ワークロードの実行の構成に使用される、プロパティ名と値のマッピング。

repository_config

RepositoryConfig

省略可。依存関係リポジトリの構成。

autotuning_config

AutotuningConfig

省略可。ワークロードの自動チューニング構成。

cohort

string

省略可。コホート ID。同じシェイプのワークロードのグループを識別します(日次 ETL ジョブなど)。

RuntimeInfo

ワークロードの実行に関するランタイム情報。

フィールド
endpoints

map<string, string>

出力専用。リモート アクセス エンドポイント(ウェブ インターフェースや API など)と URI のマッピング。

output_uri

string

出力専用。ワークロードの stdout と stderr のロケーションを指す URI。

diagnostic_output_uri

string

出力専用。診断用 tarball の場所を指す URI。

approximate_usage

UsageMetrics

出力専用。ワークロードの完了時に計算されるワークロード リソースの使用量の概算(Dataproc サーバーレスの料金をご覧ください)。

注: この指標の計算は、ワークロードの実行中にワークロード リソースの累積消費量をキャプチャするなど、今後変更される可能性があります(お知らせ、変更、修正、その他の Dataproc の開発については、Dataproc サーバーレス リリースノートをご覧ください)。

current_usage

UsageSnapshot

出力専用。現在のワークロードのリソース使用量のスナップショット。

セッション

セッションを表します。

フィールド
name

string

必須。セッションのリソース名。

uuid

string

出力専用。セッション UUID(一意のユニバーサル識別子)。この値は、サービスがセッションを作成するときに生成されます。

create_time

Timestamp

出力専用。セッションが作成された時刻。

runtime_info

RuntimeInfo

出力専用。セッション実行に関するランタイム情報。

state

State

出力専用。セッションの状態。

state_message

string

出力専用。セッションの状態の詳細(状態が FAILED の場合のエラーの説明など)。

state_time

Timestamp

出力専用。セッションが現在の状態になった時刻。

creator

string

出力専用。セッションを作成したユーザーのメールアドレス。

labels

map<string, string>

省略可。セッションに関連付けるラベル。ラベルのキーは 1 ~ 63 文字で、RFC 1035 に準拠している必要があります。ラベルのは空にできますが、指定する場合は 1 ~ 63 文字で、RFC 1035 に準拠している必要があります。1 つのセッションに関連付けることができるラベルは 32 個までです。

runtime_config

RuntimeConfig

省略可。セッション実行のランタイム構成。

environment_config

EnvironmentConfig

省略可。セッション実行の環境構成。

user

string

省略可。セッションを所有するユーザーのメールアドレス。

state_history[]

SessionStateHistory

出力専用。セッションの過去の状態情報。

session_template

string

省略可。セッションで使用されるセッション テンプレート。

プロジェクト ID とロケーションを含むリソース名のみが有効です。

例: * https://www.googleapis.com/compute/v1/projects/[project_id]/locations/[dataproc_region]/sessionTemplates/[template_id] * projects/[project_id]/locations/[dataproc_region]/sessionTemplates/[template_id]

テンプレートは、セッションと同じプロジェクトと Dataproc リージョンに存在する必要があります。

共用体フィールド session_config。セッション構成。session_config は次のいずれかになります。
jupyter_session

JupyterConfig

省略可。Jupyter セッション構成。

spark_connect_session

SparkConnectConfig

省略可。Spark Connect セッション構成。

SessionStateHistory

過去の状態情報。

フィールド
state

State

出力専用。セッション履歴のこの時点でのセッションの状態。

state_message

string

出力専用。セッション履歴のこの時点での状態に関する詳細。

state_start_time

Timestamp

出力専用。セッションが履歴状態になった時刻。

セッション状態。

列挙型
STATE_UNSPECIFIED セッションの状態は不明です。
CREATING セッションは実行前に作成されます。
ACTIVE セッションが実行中です。
TERMINATING セッションが終了します。
TERMINATED セッションが正常に終了します。
FAILED エラーが発生したため、セッションが実行されなくなりました。

SessionOperationMetadata

セッション オペレーションを記述するメタデータ。

フィールド
session

string

オペレーションのセッションの名前。

session_uuid

string

オペレーションのセッション UUID。

create_time

Timestamp

オペレーションが作成された時刻。

done_time

Timestamp

オペレーションが完了した時刻。

operation_type

SessionOperationType

オペレーションのタイプ。

description

string

オペレーションの簡単な説明。

labels

map<string, string>

オペレーションに関連付けられているラベル。

warnings[]

string

オペレーションの実行中に発生した警告。

SessionOperationType

Session リソースのオペレーション タイプ

列挙型
SESSION_OPERATION_TYPE_UNSPECIFIED セッション オペレーションのタイプが不明です。
CREATE セッション作成オペレーション タイプ。
TERMINATE セッションの終了オペレーション タイプ。
DELETE セッションの削除オペレーション タイプ。

SessionTemplate

セッション テンプレートの表現。

フィールド
name

string

必須。セッション テンプレートのリソース名。

description

string

省略可。テンプレートの簡単な説明。

create_time

Timestamp

出力専用。テンプレートが作成された時刻。

creator

string

出力専用。テンプレートを作成したユーザーのメールアドレス。

labels

map<string, string>

省略可。このテンプレートを使用して作成されたセッションに関連付けるラベル。ラベルのキーは 1 ~ 63 文字で、RFC 1035 に準拠している必要があります。ラベルのは空にできますが、指定する場合は 1 ~ 63 文字で、RFC 1035 に準拠している必要があります。1 つのセッションに関連付けることができるラベルは 32 個までです。

runtime_config

RuntimeConfig

省略可。セッション実行のランタイム構成。

environment_config

EnvironmentConfig

省略可。セッション実行の環境構成。

update_time

Timestamp

出力専用。テンプレートが最後に更新された日時。

uuid

string

出力専用。セッション テンプレートの UUID(一意のユニバーサル ID)。この値は、サービスがセッション テンプレートを作成するときに生成されます。

共用体フィールド session_config。セッション構成。session_config は次のいずれかになります。
jupyter_session

JupyterConfig

省略可。Jupyter セッション構成。

spark_connect_session

SparkConnectConfig

省略可。Spark Connect セッション構成。

SparkBatch

Apache Spark バッチ ワークロードを実行するための構成。

フィールド
args[]

string

省略可。ドライバに渡す引数。--conf など、バッチ プロパティとして設定できる引数は含めないでください。競合が発生して、バッチが正しく送信されない可能性があります。

jar_file_uris[]

string

省略可。Spark ドライバとタスクのクラスパスに追加する JAR ファイルの HCFS URI。

file_uris[]

string

省略可。各エグゼキュータの作業ディレクトリに配置されるファイルの HCFS URI。

archive_uris[]

string

省略可。各エグゼキュータの作業ディレクトリに解凍されるアーカイブの HCFS URI。サポートされているファイル形式: .jar.tar.tar.gz.tgz.zip

共用体フィールド driver。Spark ワークロードを駆動するために呼び出すメインメソッドの仕様。メインクラスを含む jar ファイルまたはメインクラス名のいずれかを指定します。メイン JAR とその JAR 内のメインクラスの両方を渡すには、JAR を jar_file_uris に追加し、main_class にメインクラス名を指定します。driver は次のいずれかになります。
main_jar_file_uri

string

省略可。メインクラスを含む jar ファイルの HCFS URI。

main_class

string

省略可。ドライバのメインクラスの名前。クラスを含む jar ファイルは、クラスパス内にあるか、jar_file_uris で指定する必要があります。

SparkConnectConfig

この型にはフィールドがありません。

インタラクティブ セッション用の Spark Connect 構成。

SparkHistoryServerConfig

ワークロードの Spark History Server 構成。

フィールド
dataproc_cluster

string

省略可。ワークロードの Spark 履歴サーバーとして機能する既存の Dataproc クラスタのリソース名。

例:

  • projects/[project_id]/regions/[region]/clusters/[cluster_name]

SparkRBatch

Apache SparkR バッチ ワークロードを実行するための構成。

フィールド
main_r_file_uri

string

必須。ドライバとして使用するメインの R ファイルの HCFS URI。.R ファイルまたは .r ファイルである必要があります。

args[]

string

省略可。Spark ドライバに渡す引数。--conf など、バッチ プロパティとして設定できる引数は含めないでください。競合が発生して、バッチが正しく送信されない可能性があります。

file_uris[]

string

省略可。各エグゼキュータの作業ディレクトリに配置されるファイルの HCFS URI。

archive_uris[]

string

省略可。各エグゼキュータの作業ディレクトリに解凍されるアーカイブの HCFS URI。サポートされているファイル形式: .jar.tar.tar.gz.tgz.zip

SparkSqlBatch

Apache Spark SQL クエリをバッチ ワークロードとして実行するための構成。

フィールド
query_file_uri

string

必須。実行する Spark SQL クエリを含むスクリプトの HCFS URI。

query_variables

map<string, string>

省略可。クエリ変数名と値のマッピング(Spark SQL コマンド SET name="value"; と同等)。

jar_file_uris[]

string

省略可。Spark CLASSPATH に追加する JAR ファイルの HCFS URI。

TerminateSessionRequest

インタラクティブ セッションを終了するためのリクエスト。

フィールド
name

string

必須。終了するセッション リソースの名前。

認可には、指定されたリソース name に対する次の IAM の権限が必要です。

  • dataproc.sessions.terminate
request_id

string

省略可。リクエストの識別に使用される一意の ID。サービスが同じ ID の 2 つの TerminateSessionRequest を受信した場合、2 回目のリクエストは無視されます。

推奨: この値は UUID に設定します。

値に使用できるのは、英字(a ~ z、A ~ Z)、数字(0 ~ 9)、アンダースコア(_)、ハイフン(-)のみです。最大長は 40 文字です。

UpdateSessionTemplateRequest

セッション テンプレートを更新するためのリクエスト。

フィールド
session_template

SessionTemplate

必須。更新されたセッション テンプレート。

認可には、指定されたリソース sessionTemplate に対する次の IAM の権限が必要です。

  • dataproc.sessionTemplates.update

UsageMetrics

使用状況の指標は、ワークロードによって使用されるリソースのおおよその合計を表します。

フィールド
milli_dcu_seconds

int64

省略可。DCU(Dataproc コンピューティング ユニット)の使用量(milliDCU x seconds)(Dataproc Serverless の料金をご覧ください)。

shuffle_storage_gb_seconds

int64

省略可。シャッフル ストレージの使用量(GB x seconds)(Dataproc サーバーレスの料金をご覧ください)。

milli_accelerator_seconds

int64

省略可。アクセラレータの使用量(milliAccelerator x seconds)(Dataproc Serverless の料金をご覧ください)。

accelerator_type

string

省略可。使用されているアクセラレータのタイプ(該当する場合)

UsageSnapshot

使用状況スナップショットは、指定された時点でワークロードによって消費されたリソースを表します。

フィールド
milli_dcu

int64

省略可。ミリ(1,000 分の 1)Dataproc コンピューティング ユニット(DCU)(Dataproc サーバーレスの料金をご覧ください)。

shuffle_storage_gb

int64

省略可。シャッフル ストレージの容量(ギガバイト単位)。(Dataproc サーバーレスの料金をご覧ください)。

milli_dcu_premium

int64

省略可。ミリ(1,000 分の 1)Dataproc コンピューティング ユニット(DCU)は、プレミアム ティアで課金されます(Dataproc サーバーレスの料金をご覧ください)。

shuffle_storage_gb_premium

int64

省略可。シャッフル ストレージ(ギガバイト単位、GB)はプレミアム ティアで課金されます。(Dataproc サーバーレスの料金をご覧ください)。

milli_accelerator

int64

省略可。ミリ(1,000 分の 1)アクセラレータ。(Dataproc サーバーレスの料金をご覧ください)。

accelerator_type

string

省略可。使用されているアクセラレータのタイプ(該当する場合)

snapshot_time

Timestamp

省略可。使用状況スナップショットのタイムスタンプ。