排查 Cloud Data Fusion 问题

本页面介绍如何解决 Cloud Data Fusion 的问题。

检索失败的流水线运行的错误信息

当流水线运行失败时,您可以检索详细的错误信息。Cloud Data Fusion 6.11.0 会按类别、原因和消息对流水线错误进行分类。这种分类有助于加快问题解决速度,减少检查复杂日志的需要。

如需获取错误详情,请按以下步骤操作:

控制台

  1. 在 Google Cloud 控制台中,打开您的 Cloud Data Fusion 实例,然后前往 Studio 页面上的流水线。

  2. 在发生错误的节点上,点击查看错误

  3. 查看错误详情,包括错误类别、错误原因和错误消息。

  4. 可选:如需下载原始日志以进行进一步分析,请点击下载原始日志

  5. 可选:如需查看原始日志,请点击查看日志

REST

向以下端点发送 POST 请求:

 curl -H "Authorization: Bearer $(gcloud auth print-access-token)"
 -H "Content-Type: application/json" 
 ${CDAP_ENDPOINT}/v3/namespaces/NAMESPACE_ID/apps/PIPELINE_NAME/workflows/DataPipelineWorkflow/runs/RUN_ID/classify -X POST

替换以下内容:

  • NAMESPACE_ID:命名空间的 ID
  • PIPELINE_NAME:流水线的名称
  • RUN_ID:流水线的运行 ID

以下是插件错误的示例响应:

 [
    {
       "stageName": "Stage Name",
       "errorCategory": "Plugin-x",
       "errorReason": "Input path gs://x does not exist",
       "errorMessage": "Input path gs://x does not exist",
       "errorType": "SYSTEM/USER/UNKNOWN",
       "dependency": "true/false"
    }
 ]
 ```
You can also [view advanced logs for your pipelines](/data-fusion/docs/how-to/viewing-stackdriver-logs).

解决创建 Cloud Data Fusion 实例时遇到的问题

创建 Cloud Data Fusion 实例时,您可能会遇到以下问题:

Read access to project PROJECT_ID was denied.

如需解决此问题,请停用并重新启用 Cloud Data Fusion API,然后创建实例。