使用 Data Boost 导出数据

本页面介绍了如何使用 Spanner Data Boost 导出 Spanner 数据,且对预配的 Spanner 实例上的现有工作负载几乎没有影响。

如需了解 Data Boost,请参阅 Data Boost 概览

您可以使用 Spanner 控制台中的导出数据页面或使用 Dataflow 模板导出数据。

准备工作

确保您拥有 spanner.databases.useDataBoost Identity and Access Management (IAM) 权限。如需了解详情,请参阅使用 IAM 进行访问权限控制

使用 Spanner 控制台导出数据

如需使用 Spanner 控制台以 Avro 格式导出数据,请执行以下操作:

  1. 请按照将数据库从 Spanner 导出到 Avro 中的说明操作。

  2. 选中使用 Spanner Data Boost 复选框。

如需以 CSV 格式导出数据,请执行以下操作:

使用 Dataflow 模板导出数据

如需使用 Data Boost 运行 Dataflow 导出作业,请选择以下选项之一:

控制台

  1. 前往以下任一页面:

  2. 按照运行模板下的控制台说明操作。

  3. 基于模板创建作业页面上的可选参数下的使用 Spanner Data Boost 字段中,输入 true

gcloud CLI

  1. 前往以下任一页面:

  2. 按照运行模板下的 gloud 说明操作。

  3. 向命令添加以下参数:

    dataBoostEnabled=true
    

    以下示例运行了“Spanner to Cloud Storage Avro”模板,并指定使用 Data Boost。

    gcloud dataflow jobs run my_export_job \
    --gcs-location gs://dataflow-templates/latest/Cloud_Spanner_to_GCS_Avro \
    --region us-central1 \
    --staging-location gs://mybucket/temp \
    --parameters \
    instanceId=my_instance,\
    databaseId=my_database,\
    outputDir=gs://mybucket/export \
    dataBoostEnabled=true

后续步骤