Spark 运行时版本 2.3 组件
注意:
2.3
运行时使用UTF-8
默认字符编码。
Spark 运行时 2.3 库
学习库(例如 TensorFlow、PyTorch 和 XGBoost),并为机器学习和数据科学应用提供可供直接使用的环境。
以下部分列出了 Dataproc Serverless for Spark 运行时版本 2.3
中提供的库版本。
GPU 专用库
对于使用 GPU 虚拟机的 Dataproc Serverless 批处理工作负载,Dataproc Serverless 容器中提供了以下 NVIDIA 驱动程序和库。您可以使用它们来完成以下任务:
- 使用 NVIDIA Spark Rapids 库加速 Spark 批处理工作负载
- 训练机器学习工作负载
- 使用 Spark 运行分布式批量推理
软件包名称 | 版本 |
---|---|
Spark Rapids | 25.02.1 |
NVIDIA 驱动程序 | 570.133.20 |
CUDA | 12.9 |
cublas | 12.9.0 |
cusolver | 11.7.4 |
cupti | 12.9 |
cusparse | 12.5.9 |
cuDNN | 9.10 |
NCCL | 2.26 |
XGBoost 库
Dataproc Serverless for Spark 运行时版本 2.2
中提供了以下 Maven 软件包版本,以便在 Java 或 Scala 中将 XGBoost 与 Spark 搭配使用。
群组 ID | 软件包名称 | 版本 |
---|---|---|
ml.dmlc | xgboost4j-gpu_2.13 | 2.1.4 |
ml.dmlc | xgboost4j-spark-gpu_2.13 | 2.1.4 |
Python 库
Dataproc Serverless for Spark 运行时版本 2.3
包含以下 Python 库版本。
软件包名称 | 版本 |
---|---|
加速 | 1.7 |
bigframes | 2.4 |
cookiecutter | 2.6 |
cython | 3.1 |
dask | 2025.5 |
数据集 | 3.6 |
deepspeed | 0.16 |
delta-spark | 3.2 |
evaluate | 0.4 |
fastavro | 1.9 |
fastparquet | 2024.11 |
gcsfs | 2025.3 |
git | 2.49 |
google-auth-oauthlib | 1.2 |
google-cloud-aiplatform | 1.94 |
google-cloud-bigquery | 3.33 |
google-cloud-bigquery-storage | 2.31 |
google-cloud-bigtable | 2.31 |
google-cloud-container | 2.56 |
google-cloud-datacatalog | 3.27 |
google-cloud-dataproc | 5.18 |
google-cloud-datastore | 2.21 |
google-cloud-dlp | 3.29 |
google-cloud-language | 2.17 |
google-cloud-logging | 3.12 |
google-cloud-monitoring | 2.27 |
google-cloud-pubsub | 2.29 |
google-cloud-redis | 2.18 |
google-cloud-secret-manager | 2.23 |
google-cloud-spanner | 3.54 |
google-cloud-speech | 2.32 |
google-cloud-storage | 2.19 |
google-cloud-texttospeech | 2.27 |
google-cloud-translate | 3.20 |
google-cloud-vision | 3.10 |
httplib2 | 0.22 |
huggingface_hub | 0.31 |
ipyparallel | 9.0 |
ipython-sql | 0.3 |
ipywidgets | 8.1 |
jupyter_http_over_ws | 0.0 |
jupyterlab | 4.4 |
jupyterlab-git | 0.51 |
keyrings.google-artifactregistry-auth | 1.1 |
langchain | 0.3 |
lightgbm | 4.6 |
Markdown | 3.8 |
matplotlib | 3.9 |
nbclassic | 1.3 |
nbconvert | 7.16 |
nbdime | 4.0 |
nltk | 3.9 |
nodejs | 22.13 |
numba | 0.61 |
numpy | 1.26 |
oauth2client | 4.1 |
onnx | 1.17 |
openblas | 0.3 |
opencv | 4.10 |
orc | 2.0 |
pandas | 2.2 |
造纸厂 | 2.6 |
pyarrow | 15.0 |
pydot | 4.0 |
pyhive | 0.7 |
pyiceberg | 0.9 |
pymongo | 4.11 |
pynvml | 12.0 |
pytables | 3.10 |
pytorch-gpu | 2.4 |
regex | 2024.11 |
请求 | 2.32 |
rtree | 1.4 |
scikit-image | 0.25 |
scikit-learn | 1.6 |
scipy | 1.13 |
seaborn | 0.13 |
sentence-transformers | 4.1 |
shap | 0.47 |
spark-tensorflow-distributor | 1.0 |
sparksql-magic | 0.0.3 |
Sqlalchemy | 2.0 |
sympy | 1.14 |
词元化器 | 0.21 |
torcheval | 0.0.7 |
torchvision | 0.19 |
toree | 0.5 |
龙卷风 | 6.5 |
transformers | 4.52 |
uritemplate | 4.1 |
virtualenv | 20.31 |
词云 | 1.9 |
xgboost | 2.1 |
ydata-profiling | 4.16 |
R 库
Dataproc Serverless for Spark 运行时版本 2.3
包含以下 R 库版本。
软件包名称 | 版本 |
---|---|
askpass | 1.2 |
assertthat | 0.2 |
向后移植 | 1.5 |
位 | 4.6 |
bit64 | 4.6 |
blob | 1.2 |
启动 | 1.3_31 |
冲泡 | 1.0_10 |
扫帚 | 1.0 |
callr | 3.7 |
脱字符号 | 6.0_94 |
cellranger | 1.1 |
chron | 2.3_62 |
class | 7.3_23 |
CLI | 3.6 |
clipr | 0.8 |
集群 | 2.1 |
codetools | 0.2_20 |
colorspace | 2.1_1 |
commonmark | 1.9 |
cpp11 | 0.5 |
蜡笔 | 1.5 |
curl | 6.2 |
data.table | 1.17 |
dbi | 1.2 |
dbplyr | 2.5 |
降序 | 1.4 |
devtools | 2.4 |
摘要 | 0.6 |
dplyr | 1.1 |
省略号 | 0.3 |
evaluate | 1.0 |
fansi | 1.0 |
fastmap | 1.2 |
forcats | 1.0 |
foreach | 1.5 |
外部 | 0.8_90 |
fs | 1.6 |
future | 1.49 |
泛型 | 0.1 |
ggplot2 | 3.5 |
gh | 1.4 |
glmnet | 4.1_8 |
全局变量 | 0.18 |
胶水 | 1.8 |
gower | 1.0 |
gtable | 0.3 |
避风港 | 2.5 |
highr | 0.11 |
hms | 1.1 |
htmltools | 0.5.8 |
htmlwidgets | 1.6 |
httpuv | 1.6 |
httr | 1.4 |
hwriter | 1.3.2 |
ini | 0.3 |
ipred | 0.9_15 |
isoband | 0.2 |
迭代器 | 1.0 |
jsonlite | 2.0 |
kernsmooth | 2.23_26 |
knitr | 1.50 |
标签 | 0.4 |
稍后 | 1.4 |
晶格 | 0.22_7 |
岩浆 | 1.8 |
生命周期 | 1.0 |
listenv | 0.9 |
lubridate | 1.9 |
magrittr | 2.0 |
Markdown | 2.0 |
质量 | 7.3_60 |
矩阵 | 1.6_5 |
memoise | 2.0 |
mgcv | 1.9_3 |
MIME | 0.13 |
modelmetrics | 1.2.2 |
modelr | 0.1 |
Munsell | 0.5 |
nlme | 3.1_168 |
nnet | 7.3_20 |
numderiv | 2016.8_1 |
openssl | 2.3 |
支柱 | 1.10 |
pkgbuild | 1.4 |
pkgconfig | 2.0 |
pkgload | 1.4 |
plogr | 0.2 |
plyr | 1.8 |
赞美 | 1.0 |
prettyunits | 1.2 |
processx | 3.8 |
prodlim | 2025.04 |
#googlecloudcertifiedprogress 标签 | 1.2 |
promise | 1.3 |
proto | 1.0 |
ps | 1.9 |
purrr | 1.0 |
r6 | 2.6 |
randomforest | 4.7_1 |
rappdirs | 0.3 |
rcmdcheck | 1.4 |
rcolorbrewer | 1.1_3 |
rcpp | 1.0 |
rcurl | 1.98_1 |
readr | 2.1 |
readxl | 1.4 |
食谱 | 1.3 |
推荐 | 4.3 |
再玩一局 | 2.0 |
遥控器 | 2.5 |
reprex | 2.1 |
reshape2 | 1.4 |
rlang | 1.1 |
rmarkdown | 2.29 |
rodbc | 1.3_25 |
roxygen2 | 7.3 |
rpart | 4.1 |
rprojroot | 2.0 |
rserve | 1.8_14 |
rsqlite | 2.3 |
rstudioapi | 0.17 |
rvest | 1.0 |
鳞片 | 1.4 |
selectr | 0.4_2 |
sessioninfo | 1.2 |
shape | 1.4.6 |
闪亮 | 1.10 |
sourcetools | 0.1 |
空间 | 7.3_18 |
平方米 | 2021.1 |
stringi | 1.8 |
stringr | 1.5 |
生存 | 3.8_3 |
sys | 3.4 |
teachingdemos | 2.13 |
testthat | 3.2 |
tibble | 3.2 |
tidyr | 1.3 |
tidyselect | 1.2 |
tidyverse | 2.0 |
timedate | 4041.110 |
tinytex | 0.57 |
usethis | 3.1 |
utf8 | 1.2 |
uuid | 1.2_1 |
vctrs | 0.6 |
胡须 | 0.4 |
withr | 3.0 |
xfun | 0.52 |
xml2 | 1.3 |
xopen | 1.0 |
xtable | 1.8_4 |
yaml | 2.3 |
zip | 2.3 |